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1.1. Khái niệm nghiên cứu và cách tiếp cận nghiên cứu 
1.1.1. Khái niệm nghiên cứu 

Nghiên cứu là sự tìm kiếm kiến thức, hoặc là sự điều tra mang tính hệ thống, VỚI 
suy nghĩ mở rộng để khám phá, giải thích và phát triển các phương pháp nhằm vào sự tiễn 
bộ kiến thức của nhân loại. 

Theo Babble (1986) : Nghiên cứu là quá trình thu thập dữ liệu và phân tích thông tin 
một cách hệ thống nhằm tăng cường sự hiểu biết về một hiện tượng. 

Theo Kothari (2004) : Nghiên cứu là quá trình thu thập, phân tích dữ liệu một cách 
có hệ thống nhằm khám phá các vấn đề liên quan. 

Theo Kumar (2014) : Nghiên cứu là một trong những cách tìm ra các câu trả lời cho 
các câu hỏi. 

Theo Shutileworth (2008) : Nghiên cứu là bao gồm mọi cách thức thu thập dữ liệu, 
thông tin và sự kiện cho sự phát triển kiến thức. 

Nghiên cứu là quá trình thu thập và phân tích thông tin một cách có hệ thống nhằm 
tăng cường sự hiểu biết về một hiện tượng hay một vấn đề nào đó. 

Nghiên cứu khoa học 

Theo Babbie (2011) : Nghiên cứu khoa học là cách thức : con người tìm hiểu các 
hiện tượng khoa học một cách có hệ thống và quá trình áp dụng các ý tưởng, nguyên lý để 
tìm ra các kiến thức mới nhằm giải thích các sự vật hiện tượng. 

Theo Armstrong và Sperry (1994) : Nghiên cứu khoa học dựa vào việc ứng dụng 
các phương pháp khoa học đề phát hiện ra những cái mới về bản chất sự vật, về thế giới tự 
nhiện và xã hội, và để sáng tạo phương pháp và phương tiện kỹ thuật mới cao hơn, giá trị 
hơn. Hình thức nghiên cứu này cung cấp thông tin và lý thuyết khoa học nhằm giải thích 
bản chất và tính chất của thế giới. 

Nghiên cứu khoa học là hoạt động tìm kiếm, xem xét, điều tra, hoặc thử nghiệm. 
Dựa trên những số liệu, tài liệu, kiến thức,... đạt được từ các thí nghiệm nghiên cứu khoa 
học để phát hiện những cái mới về bản chất sự vật, về thế giới tự nhiên và xã hội, và để 
sáng tạo phương pháp và phương tiện kỹ thuật mới cao hơn, giá trị hơn. Con người muốn 
nghiên cứu khoa học phải có kiến thức nhất định về lĩnh vực nghiên cứu và cái chính là 
phải rèn luyện cách làm việc tự lực, có phương pháp từ lúc ngồi trên ghế nhà trường. 

Vai trò của nghiên cứu khoa học 
Nghiên cứu là để truyền tải thông tin. Tuy nhiên một bài nghiên cứu hiệu quả phải: 
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- Làm thay đổi cách nhìn nhận vấn đề của người đọc. 

- Thuyết phục người đọc tin vào một điều gì đó. 

- Đưa người đọc đến quyết định và hành động. 

- Dẫn dắt người đọc theo một quy trình nào đó. 

Phương pháp nghiên cứu 

Theo Yang (2001), phương pháp nghiên cứu cung cấp các chỉ tiết của quy trình và 
phương pháp cụ thể để thực hiện một vấn đề nghiên cứu. Phương pháp nghiên cứu cung 
cấp các quy trình cụ thể và chỉ tiết làm thế nào đề bắt đầu, thực hiện và hoàn thành nhiệm 
vụ nghiên cứu và chủ yếu là tập trung vào làm thế nào đề thực hiện được nghiên cứu. 

Theo nghĩa hẹp, phương pháp nghiên cứu là phương pháp thu thập thông tin. 
Connaway và Powell (2003) cho rằng có rất nhiều cách để có được thông tin. Các phương 
pháp nghiên cứu phổ biến nhất là tìm kiếm tài liệu, hội thảo, hội thảo nhóm, phỏng vấn cá 
nhân, các cuộc điều tra qua điện thoại, các cuộc điều tra qua thư bưu điện và điều tra qua 
thư điện tử và mạng. 

Phương pháp nghiên cứu đối với nhà kinh tế là tìm hiểu bản chất những vấn đề kinh 
tế đang cần giải quyết của hộ gia đình, doanh nghiệp, cộng đồng hay các nhà hoạch định 
chính sách ở phạm vi địa phương, quốc gia hay cộng đồng quốc tế nói chung. Các nhà kinh 
tế đã phát triển lý thuyết về cách thức hoạt động của thị trường, làm thế nào các hoạt động 
kinh tế được tiến hành trong các quốc gia hoặc trên phạm vi toàn cầu. Do đó, nghiên cứu 
kinh tế được chia thành hai nhóm chính: Nghiên cứu cơ bản và nghiên cứu ứng dụng. 

1.1.2. Cách tiếp cận nghiên cứu 
Giới thiệu về phương pháp nghiên cứu định tính 

Nghiên cứu định tính là một dạng nghiên cứu được tạo thành từ các phương pháp 
kỹ thuật chuyên môn được sử dụng để tìm hiểu sâu về các phản ứng từ trong suy nghĩ và 
tình cảm của con người 

Theo Marshall và Rossman (1998): Nghiên cứu định tính là một phương pháp điều 
tra được sử dụng trong nhiều lĩnh vực khoa học kỹ thuật khác nhau, không những trong 
khoa học xã hội mà còn trong nghiên cứu kinh tế. Mục đích của nghiên cứu định tính nhằm 
tìm kiếm sự hiểu biết sâu sắc về hành vi của con người và lý do chỉ phối hành vi như vậy. 
Nghiên cứu định tính điều tra lý do tại sao và làm như thế nào của VIỆC ra quyết định, 
không chỉ là những gì, mà còn ở đâu, khi nào. Nghiên cứu định tính đưa ra các kết luận 
tổng quát hơn là các kết luận cụ thê: 

Nghiên cứu định tính là loại hình nghiên cứu nhằm mô tả sự vật hiện tượng mà 
không quan tâm đến sự biến thiên của đối tượng nghiên cứu và không nhằm lượng hóa sự 


biên thiên này. 


Nghiên cứu định tính hướng đến ý nghĩa các khái niệm, định nghĩa, đặc điểm và sự 
mô tả đối tượng nghiên cứu. 
Nghiên cứu định tính thường được áp dụng trong xã hội học, tâm lý học, kinh tế 
học, kinh tế chính trị, luật,... 
Nghiên cứu định tính thường dùng các phương pháp phân tích, so sánh, tổng hợp, 


mô tả, logic,... 


Nghiên cứu định tính thường được áp dụng giai đoạn thu thập dữ liệu và phân tích 
dữ liệu. Ở giai đoạn thu thập dữ liệu, các kỹ thuật nghiên cứu định tính thường được áp 
dụng gồm nghiên cứu lý thuyết nền, phỏng vấn nhóm, phỏng vấn chuyên gia, nghiên cứu 
tình huống, quan sát,... 

Ở giai đoạn phân tích dữ liệu, nghiên cứu định tính được sử dụng các kỹ thuật phân 
tích nội dung với các dữ liệu thu thập, quan sát hành vi cũng như các chứng cứ, sự kiện thu 
thập được. 

Giới thiệu về phương pháp nghiên cứu định lượng 

Theo Ehrenberg (1994): Nghiên cứu định lượng thường được sử dụng để kiểm định 
lý thuyết dựa vào cách tiếp cận suy diễn. 

Theo Daniel MuiJs, (2004) : Nghiên cứu định lượng là phương pháp giải thích hiện 
tượng thông qua phân tích thống kê với đữ liệu định lượng thu thập được. 

Nghiên cứu định lượng là loại hình nghiên cứu mà ta muốn lượng hóa sự biến thiên 
của đối tượng nghiên cứu và công cụ thống kê, mô hình hóa được sử dụng cho việc lượng 
hóa các thông tin của nghiên cứu định lượng. 

Các phương pháp định lượng bao gồm các quy trình thu thập đữ liệu, phân tích dữ 
liệu, giải thích và viết kết quả nghiên cứu. 

Các phương pháp này liên quan đến sự xác định mẫu, chiến lược điều tra, thu thập 
dữ liệu, phân tích đữ liệu, trình bày kết quả nghiên cứu, thảo luận kết quả và viết công trình 
nghiên cứu. 

Nghiên cứu định lượng phù hợp với các nghiên cứu xác định các yếu tố ảnh hưởng 
một kết quả nào đó. Cách tiếp cận định lượng thực hiện khi cần kiểm định các giả thuyết 
khác nhau và một lý thuyết nào đó. 


So sánh phương pháp nghiên cứu định tính, định lượng 


Thứ tự| Nội dung Định tính Định lượng 
1 Mục tiêu Hiểu sâu sắc, xây dựng| Mô tả hoặc dự báo, xây 
Nghiên cứu | lý thuyết dựng hoặc kiểm định lý 
thuyết 


Độ Thiết kế 


Có thê điều chỉnh trong 


Được quyết định trước khi 


nghiên quá trình thực hiện. bắt đầu nghiên cứu. 
cứu Thường phối hợp| Sử dụng một hay phối hợp 
nhiều phương pháp nhiều phương pháp. 
3 Chọn mẫu, | Phi xác suất, có mục| Xác suất, cỡ mẫu lớn 
cỡ mẫu đích. Cỡ mẫu nhỏ 
4 Phân tích| Phân tích bằng con | Phân tích bằng máy. Các 
dữ liệu người và thực hiện liên | phương pháp toán và thống 


tục trong quá trình 
nghiên cứu 


kê làm chủ đạo. Phân tích 


có thê diễn ra suôt quá trình 


nghiên cứu. 


Bảng 1.1. So sánh nghiên cứu định tính và nghiên cứu định lượng. 
Giới thiệu phương pháp nghiên cứu hỗn hợp 

Nghiên cứu phối hợp giữa định tính và định lượng được sử dụng khá phô biến trong 
các ngành kinh tế, quản trị, tài chính,... 

Trong quá trình nghiên cứu, chúng ta muốn hiểu rõ bản chất sự vật, nghiên cứu cơ 
sở lý thuyết, xây dựng mô hình hay khung phân tích thì phải dùng phương pháp nghiên cứu 
định tính với các công cụ tổng hợp, phân tích, so sánh đối chiếu, chuyên gia,... 

Đồng thời, trong nghiên cứu chúng ta thường dựa trên một quan sát với cỡ mẫu đủ 
lớn để có kết quả tin cậy cần thiết. Chúng ta dùng dữ liệu, thông tin của mẫu đề ước đoán 
số liệu, thông tin tổng thể nghiên cứu. Vì vậy phương pháp định lượng là hiển nhiên. 

Khi so sánh nghiên cứu định lượng và định tính, Wilson (1982) lập luận rằng, VIỆC 
sử dụng cân bằng cả hai nên được sử dụng trong nghiên cứu hiện đại. Thực hiện sự kết hợp 
này là sử dụng thế mạnh của cả hai nghiên cứu định tính và định lượng. Hơn nữa, phương 
pháp hỗn hợp có thê giải quyết sự phức tạp ngày càng tăng của thực tế xã hội. Hiểu biết có 
được sự kết hợp của cả hai phương pháp nghiên cứu định tính và định lượng cung cấp một 
sự hiểu biết tốt hơn và mở rộng của chủ đề nghiên cứu. Ta có bảng kết quả so sánh về quy 


trình các phương pháp như sau: 


Các pháp 
nghiên cứu hỗn hợp 


Các phương pháp Các phương pháp phương 


nghiên cứu định tính nghiên cứu định lượng 


Các phương pháp mới | Các câu hỏi dựa vào một | Cả hai phương pháp mới 
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nÔI. 
Các câu hỏi mở. 
Dữ liệu phỏng vân, dữ 


liệu quan sát, dữ liệu 


công cụ xác định trước. 
Dữ liệu về kết quả hoạt 
động, dữ liệu về thái độ, 


đữ liệu quan sát, và dữ liệu 


nổi và xác định trước. 
Cả câu hỏi có mở và đóng. 
Nhiều hình thức thu thập 


dữ liệu từ mọi khả năng. 


văn bản, và đữ liệu nghe | tổng điều tra thống kê. Phân tích thống kê và văn 


nhìn. Phân tích thống kê. bản. 


Bảng 1.2. So sánh quy trình phương pháp định tính, định lượng và hỗn hợp. 
1.2. Phương pháp nghiên cứu 

Phương pháp nghiên cứu khoa học là cách thức, con đường, phương tiện để giải 
quyết các nhiệm vụ nghiên cứu nhằm đạt được mục đích nghiên cứu. Dưới góc độ thông 
tin: phương pháp nghiên cứu khoa học là cách thức, con đường, phương tiện thu thập, xử 
lý thông tin khoa học (số liệu, sự kiện) nhằm làm sáng tỏ vấn đề nghiên cứu để giải quyết 
nhiệm vụ nghiên cứu và cuối cùng đạt được mục đích nghiên cứu. Nói cách khác, phương 
pháp nghiên cứu khoa học là những phương thức thu thập và xử lý thông tin khoa học 
nhằm mục đích thiết lập những mối liên hệ và quan hệ phụ thuộc có tính quy luật và xây 
dựng lý luận khoa học mới. Dưới góc độ hoạt động: phương pháp nghiên cứu khoa học là 
hoạt động có đối tượng, chủ thể (người nghiên cứu) sử dụng những thủ thuật, biện pháp, 
thao tác tác động, khám phá đối tượng nghiên cứu nhằm làm biến đổi đối tượng theo mục 
tiêu mà chủ thê tự giác đặt ra để thỏa mãn nhu cầu nghiên cứu của bản thân. 
1.3. Quy trình nghiên cứu 
1.3.1. Khái niệm quy trình nghiên cứu 

Theo Kumar (2005), Quy trình nghiên cứu là một chuỗi các hành động diễn ra theo 
trình tự và gắn liền với nền tảng kiến thức cũng như các bước tư duy logic. Trong khái 
niệm này, quy trình nghiên cứu bao gồm một chuỗi các bước tư duy và vận dụng kiến thức 
về phương pháp nghiên cứu, kiến thức chuyên ngành, khởi đầu từ đặt vấn đề cho đến khi 
tìm ra câu trả lời. Các bước trong quy trình nghiên cứu phải theo một trình tự nhất định. 
1.3.2. Nội dung các bước của quy trình nghiên cứu 
Xác định và mô tả vẫn đề nghiên cứu 
a. Xác định vẫn đề nghiên cứu 

Đây là bước khá quan trọng trong quá trình nghiên cứu vì nếu không xác định đúng 
đề tài nghiên cứu sẽ khó thực hiện được. Đề xác định vẫn đề nghiên cứu ta cần làm rõ từng 
bước sau: 

Bước 1. Xác định rõ lĩnh vực nghiên cứu. 

Bước 2. Xác định loại vấn đề nghiên cứu. 

Bước 3. Xác định sự cần thiết của nghiên cứu. 

Bước 4. Đánh giá tính khả thị của nghiên cứu. 
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Bước 5. Trao đi với giáo viên hướng dẫn, bạn bè, chuyên gia trong lĩnh vực này. 

Bước 6. Thỏa mãn sự ưu thích, đam mê và sở trường của người nghiên cứu. 

Ví dụ 1. Xác định vấn đề nghiên cứu. Đề tài: “ Nghiên cứu các yếu tô ảnh hưởng đến thu 
hút đầu tư trực tiếp nước ngoài vào khu công nghiệp ở TPHCM”. 

Đề có thể thu hút được các doanh nghiệp đầu tư vào các khu công nghiệp ở TPHCM 
ta cần tìm hiểu yếu tố môi trường đầu tư nào tác động đến khả năng thu hút đầu tư vào các 
khu công nghiệp, từ đó tìm giải pháp thu hút đầu tư trực tiếp từ nước ngoài vào khu công 
nghiệp TPHCM. 

b. Mô tả vấn đề nghiên cứu 

Vấn đề nghiên cứu cần được mô tả làm rõ ràng các bước sau: 

Bước 1. Mục tiêu nghiên cứu 

Bước 2. Câu hỏi nghiên cứu 

Bước 3. Đối tượng nghiên cứu 

Bước 4. Phạm vi nghiên cứu 

Bước 5. Ý nghĩa và giới hạn của nghiên cứu. 

Ví dụ 2. Xác định mục tiêu nghiên cứu. Đề tài: “ Nghiên cứu các yếu tố ảnh hưởng đến thu 
hút đầu tư trực tiếp nước ngoài vào khu công nghiệp ở TPHCM”. 

Mục tiêu chung: Đánh giá thực trạng các khu công nghiệp về thu hút đầu tư trực tiếp 
nước ngoài (FDI) và xác định các yếu cố ảnh hưởng thu hút FDI trên cơ sở đó đề xuất các 
giải pháp nhằm thu hút FDI vào khu công nghiệp. 

Mục tiệu cụ thể: 

a.. Đánh giá thực trạng các khu công nghiệp về thu hút FDI 

b._ Xác định các yêu tố ảnh hưởng thu hút FDI vào khu công nghiệp. 

c.. Đề xuất các giải pháp nhằm thu hút FDI vào các khu công nghiệp. 

Ví dụ 3. Xác định câu hỏi nghiên cứu. Đề tài: “ Nghiên cứu các yếu tố ảnh hưởng đến thu 
hút đầu tư trực tiếp nước ngoài vào khu công nghiệp ở TPHCM”. 
Câu hỏi nghiên cứu: 

a.. Các yếu tô môi trường đầu tư của các KCN là gì? 

b. Những yếu tố nào làm thỏa mãn nhà đầu tư đang đầu tư và sẽ đầu tư tại đây? 

c. Mức độ tác động của các yếu tố môi trường đầu tư đến sự thỏa mãn của nhà đầu tư 

như thế nào? 

Ví dụ 4. Xác định đối tượng và phạm vi nghiên cứu. Đề tài: “ Nghiên cứu các yếu tố ảnh 
hưởng đến thu hút đầu tư trực tiếp nước ngoài vào khu công nghiệp ở TPHCM”. 

Đối tượng nghiên cứu: Lý thuyết thực trạng của môi trường đầu tư, các yếu tố ảnh 
hưởng đến thu hút đầu tư trực tiếp nước ngoài vào các khu công nghiệp TPHCM. 
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Phạm vỉ nghiên cứu: 

Nội dung: Đánh giá các nguồn lực cho phát triển - điều kiện tự nhiên, kinh tế, xã 
hội, môi trường và các KCN; môi trường đầu tư và thực trạng đầu tư vào các KCN; mức độ 
hài lòng và các yếu tố ảnh hưởng đến độ hài lòng của nhà đầu tư về môi trường đầu tư ở 
các KCN và đề xuất giải pháp thu hút đầu tư vào các KCN. 

Không gian: Các khu công nghiệp trên địa bàn TPHCM. 

Thời gian: Dữ liệu thu thập của 5 năm gần đây (2010 -2014) và dữ liệu do tác giả 
tiến hành thu thập trong năm 2014. 

Tìm hiểu cơ sở lý thuyết 

Cơ sở lý thuyết của nghiên cứu bao hàm các khái niệm, lý thuyết kinh tế học, các 
công trình nghiên cứu thực nghiệm trong và ngoải nước có liên quan: 
a. Các khái niệm 

Trong giai đoạn tìm hiểu về cơ sở lý thuyết, cần nêu rõ một số khái niệm trực tiếp 
liên quan đến vấn đề nghiên cứu. Tất cả các khái niệm được đề cập phải có nguồn gốc, 
trích dẫn rõ ràng để có giá trị tham khảo và phải có trong mục “tài liệu tham khảo” của đề 
cương nghiên cứu. 

b. Các lý thuyết kinh tế học và các công trình nghiên cứu thực nghiệm 

Các lý thuyết kinh tế học là những kết quả nghiên cứu đã được công nhận trong giới 
học thuật trên phạm vi toàn cầu, trong khi các công trình nghiên cứu thực nghiệm chỉ cho 
kết quả nghiên cứu riêng lẻ trong từng quốc gia, hay từng vùng, từng địa phương trong một 
quốc gia. Tất cả các lý thuyết được đề cập phải có nguồn góc, trích dẫn rõ ràng để có giá trị 
tham khảo và phải có trong mục “tài liệu tham khảo” của đề cương nghiên cứu. 

Xây dựng khung phân tích và giả thuyết nghiên cứu 
a. Khung phân tích của nghiên cứu 

Dựa trên lý thuyết, nghiên cứu thực nghiệm, thực tiễn địa phương, tác giả hình 
thành khung phân tích cho đề tài nghiên cứu của mình. Khung phân tích này cho thấy tác 
giả đã am tường các lý thuyết liên quan, kế thừa kết quả từ các nghiên cứu liên quan trước 
đây và cũng thể hiện được điểm mới trong nghiên cứu của mình. b. Giả thuyết nghiên 
cứu 

Giả thuyết nghiên cứu là phát biêu về mối liên hệ giữa các biến, nhà nghiên cứu sẽ 
kiểm định giả thuyết này trong quá trình nghiên cứu. Dựa trên các lý thuyết kinh tế học và 
kế thừa kết quả từ các công trình nghiên cứu thực nghiệm, tác giả hình thành quan hệ giữa 
biến đôc lập và biến phụ thuộc, tương quan cùng chiều hay ngược chiều. 

Viết đề cương nghiên cứu 
a. Khái niệm 
Đề cương nghiên cứu là một báo cáo trình bày toàn bộ các bước nghiên cứu từ vẫn 


đề đặt ra đến tiễn độ thực nghiệm nghiên cứu. 


S 


b. Nội dung của đề cương nghiên cứu 
Hiện nay trên thế giới cũng như ở Việt Nam chưa có một quy định thống nhất nào 
về nội dung đề cương nghiên cứu. Tùy thuộc vào từng trường đại học, từng quốc gia nước 
khác nhau có một vài điểm giống nhau như sau: 
L. Giới thiệu (mở đầu) 
1.1. Xác định vấn đề nghiên cứu 
1.2. Tính cấp thiết của đề tài 


1.3. Mục tiêu nghiên cứu 


1.4. Câu hỏi nghiên cứu 
1.5. Phạm vi nghiên cứu 


1.6. Ý nghĩa và giới hạn của nghiên cứu 


2. Tổng quan tài liệu và cơ sở lý thuyết 
2.1. Khái niệm 
2.2. Lý thuyết liên quan 


2.3. Các nghiên cứu trong và ngoài nước liên quan đê tài nghiên cứu 


3. Khung phân tích và giả thuyết nghiên cứu 
3.1. Khung phân tích của nghiên cứu 
3.2. Các giả thuyết nghiên cứu 


4. Phương pháp nghiên cứu (thiết kế nghiên cứu) 
4.1. Phương pháp chọn mẫu 

4.2. Dữ liệu thu thập 

4.3. Công cụ phân tích dữ liệu 


5. Kết câu của đề tài 
6. Tiến độ thực hiện 
7. Tài liệu tham khảo 


Bảng 1.4. Nội dung cơ bản của đề cương nghiên cứu. 

Đề minh họa cho đề cương nghiên cứu, chúng tôi giới thiệu chỉ tiết một đề cương 
nghiên cứu luận văn thạc sĩ của Cô Phùng Vũ Bảo Ngọc, Khoa Du lịch của trường Đại 
học Tài chính - Marketing (xem chương 8). 

Thiết kế nghiên cứu 
a. Phương pháp chọn mẫu 


Phương pháp chọn mẫu bao gồm các nội dung như sau: 


+) Khái niệm mâu 
+) Lý do chọn mâu 
+) Một sô định nghĩa vê mầu 


+) Xác định quy mô mẫu 


+) Phương pháp và hình thức chọn mẫu 


b. Phương pháp thu thập dữ liệu 
Có hai loại đữ liệu chính đề thu thập 
+) Dữ liệu thứ cấp: là dữ liệu do người khác thu thập, không phải do người nghiên 


cứu trực tiếp thu thập. 


+) Dữ liệu sơ cấp: là đữ liệu do người nghiên cứu trực tiếp thu thập. 


Phân tích dữ liệu và kiểm định giả thuyết 


a. Phân tích dữ liệu: Sau khi thu thập dữ liệu, ta cần tiến hành phân tích dữ liệu theo các 


mục tiêu và các giả thuyêt nghiên cứu đưa ra. 


khảo sát. 


kiêm đỊ 


') Phân tích mô tả: Sử dụng thống kê mô tả để làm rõ các thuộc tính của đối tượng 


F) Kiểm định sự khác biệt giữa hai tham số trung bình: Sử dụng các kiểm định như 
nh t đối với mẫu đôc lập, kiểm định Chi — bình phương, kiểm định phương sai một 


yếu tô để xác định sự khác biệt của các tham số trung bình có ý nghĩa. 


') Kiểm định chất lượng thang đo: Sử dụng kiểm định Cronbach”s Alpha để xác 


định chất lượng thang đo xây dựng. 


trích để 


') Phân tích nhân tố khám phá: Sử dụng kiểm định KMO, Bartlett, và phương sai 
xác định hệ thống thang đo đại diện. 
') Phân tích hồi quy tuyến tính: Sử dụng các kiểm định các hệ số hồi quy, mức độ 


phù hợp của mô hình, tự tương quan và phương sai phần dư để xác định các yếu tổ và mức 


độ ảnh hưởng của các yêu tô. 


b. Kiểm định giả thuyết: Sau khi có kết quả của việc phân tích đữ liệu, ta cần tiến hành 


kiêm ổỊ 


nh các giả thuyết đưa ra ban đầu. Có thể kết quả phân tích cho biết đữ liệu là phù 


hợp nhưng có thê khác với giả thuyết ban đầu. Trong trường hợp khác với giả thuyết ban 


đầu, ta cần điều chỉnh lại giả thuyết. 


Giải thích kêt quả và việt báo cáo 


+) Rút ra được những phát hiện nảo, kết luận nào từ kết quả? 

+) Kết quả phân tích có phù hợp với lý thuyết và thực tiễn hay không? 
+) Kết quả có gì mới hay không? 

+) Có thể đề xuất gì hay không? 


1.4. Các cầu phân cơ bản của một nghiên cứu 
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Cấu phần Nội dụng Cở sở 
Y tưởng | Nghiên cứu nhằm phát hiện điều gì | +) Hiểu biết của nhà nghiên 
và vì sao nó có ý nghĩa? cứu về lĩnh vực chuyên 
+) Phát hiện khoảng trống quan ngành. 
trọng trong nghiên cứu trước. +) Tổng quan tải liệu. 
+) Câu hỏi nghiên cứu. +) Trải nghiệm với bồi cảnh cụ 
+) Hình thành ý tưởng điểm mới và| thê. 
đóng góp của nghiên cứu 
Thiết kế | Cần những băng chứng gì để trả +) Nắm rõ mục tiêu và khung 
lời câu hỏi nghiên cứu và thu nghiên cứu. 
thập/phân tích chúng bằng cách +) Xác định các giả thuyết 
nào? “cạnh tranh” để có kế hoạch 
+) Cách tiếp cận và thiết kế tổng _ | thu thập bằng chứng, kiểm 
thê. định và bảo vệ giả thuyết 
+) Quy trình, phương pháp, công | chính. 
cụ cụ thê. +) Nắm rõ các phương pháp và 
+) Kế hoạch tiến hành và yêu cầu | công cụ có thể sử dụng. 
về nguồn lực, dữ liệu. 
+) Mức độ đáp ứng các yêu cầu 
của một nghiên cứu khoa học. +) 
Rủi ro và hạn chế của nghiên cứu. 
Phương Thực hiện việc thu thập và phân +) Nắm rõ câu hỏi và khung 
pháp và | tích dữ liệu bằng cách nào? +) Các | nghiên cứu. 
công cụ | phương pháp thu thập dữ liệu. +) Nắm rõ quy trình và kỹ 
+) Các phương pháp và công cụ thuật của từng phương pháp. 
phân tích dữ liệu. 


Bảng 1.3. Các cầu phần cơ bản của một nghiên cứu. 


1.5. Đề tài nghiên cứu và luận án nghiên cứu 


Đê tài nghiên cứu khoa học là một nghiên cứu cụ thê có mục tiêu, nội dung, 


phương pháp rõ ràng nhằm tạo ra các kết quả mới, đáp ứng yêu cầu của thực tiễn sản xuất 


lãi 


hoặc làm luận cứ xây dựng chính sách hay cơ sở cho các nghiên cứu tiếp theo. Sau đây là 
một số ví dụ về đề tài nghiên cứu khoa học: 
° Tình trạng nghèo đói ở Việt Nam: Thực trạng, nguyên nhân và giải pháp. 
° Tìm hiểu nhu cầu và sự lựa chọn của khách hàng về sản phẩm sữa. 
- Hoàn thiện tổ chức công tác kế toán tại các công ty kinh doanh 
dịch vụ cảng biến trên địa bàn tỉnh Bình Định. Hệ thống các đề tài nghiên cứu khoa học do 
Nhà nước quản lý và tài trợ thường được chia thành các cấp độ khác nhau do các cấp cơ 
quan quản lý khác nhau. Đề tài cấp nhà nước do Bộ Khoa học và công nghệ trực tiếp quản 
lý, đề tài cấp Bộ do các Bộ chuyên ngành quản lý, đề tài cấp cơ sở do các tổ chức khoa học 
công nghệ tự quản lý, đề tài địa phương do các Sở Khoa học và Công nghệ quản lý. 

Luận án nghiên cứu là một tài liệu trình bày các kết quả nghiên cứu của tác giả nộp 
cho Hội đồng khoa học để ứng cử cho các chức danh sau đại học (thạc sĩ và tiến sĩ), thể 


hiện được kiên thức cũng như các đóng góp riêng của tác giả vê chủ đê nghiên cứu. 


ly 


Chương 2 
ĐIÊU TRA CHỌN MẪU VÀ PHƯƠNG PHÁP CHỌN MẪU 


2.1. Điều tra chọn mẫu 
Mẫu và tổng thể 

Tổng thê hay còn gọi là đám đông nghiên cứu là tập hợp tất cả phần tử được định 
nghĩa là thuộc phạm vi nghiên cứu. Tổng thê nghiên cứu là tập hợp các phần tử mà thực tế 
có thể nhận dạng vả lấy mẫu. Mẫu nghiên cứu là một phần của tổng thê được lựa chọn để 
thu thập dữ liệu. 

Đơn vị lây mẫu là một hay một nhóm các phần tử để từ đó thực hiện việc lấy mẫu 
trong mỗi giai đoạn của quá trình chọn mẫu. 

Phần tử là đơn vị mà nhà nghiên cứu cần quan sát và thu thập dữ liệu (cá nhân, hộ 
gia đình, tô chức,...). 

Khung mẫu là danh sách các đơn vị lấy mẫu có sẵn để phục vụ cho việc lấy mẫu. 
Quy trình chọn mẫu 

Bước 1. Định nghĩa tổng thể và phần tử. 

Bước 2. Xác định khung lấy mẫu. 

Bước 3. Xác định kích thước mẫu. 

Bước 4. Xác định phương pháp chọn mẫu. 

Bước 5. Tiến hành lấy mẫu theo phương pháp đã chọn. 
2.2. Xác định cỡ mẫu 

- Một câu hỏi luôn đặt ra với nhà nghiên cứu là cần phải điều tra bao nhiêu 
đơn vị mẫu đề nó đại diện và có thể suy rộng cho tông thể, để phân tích có ý nghĩa và kết 
quả nghiên cứu có giá trị về mặt khoa học? 

- Một cách đơn giản và dễ nhất là dựa vào các nghiên cứu có cùng nội dung 
đã được thực hiện trước đó đề lây mẫu. 

¬ Có thể hỏi ý kiến các chuyên gia, những người có kinh nghiệm thực hiện 
các dự án điều tra khảo sát. 

- Có thể tính toán theo công thức tính mẫu. 
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* Với trường hợp cỡ mẫu lớn và không biết tổng thẻ. 


Trong đó: 
n: là cỡ mâu (quy mô mâu), 


C: Giá trị tới hạn tương ứng với độ tin cậy lựa chọn, 
Z'..P..S ĐÀ TT. VNA. .C£...V 6... S để .-.Ý...IÀ..- 2N 59V at. Si. S9 M Ê. 


Nếu biết số lượng đơn vị trong tông thê là N, tỷ lệ tông thể là p, sai số 


thì cỡ mẫu được tính theo công thức 


El M-1{ ï (š) 
n=|—+ ——= 
NN p(-p)\C 


"= 


Nếu tông thê nhỏ và biết được tông thê thì dùng công thức sau: 


Với n là cỡ mâu, N là sô lượng tông thê, e là sai sô tiêu chuân 


2.3. Các phương pháp chọn mẫu 
Phương pháp chọn mẫu ngẫu nhiên đơn giản 
Đây là phương pháp mà mỗi đối tượng trong tổng thể được gán một con số, sau đó 
các con số được lựa chọn một cách ngẫu nhiên. Thông thường các nhà nghiên cứu có thể 
dùng bảng ngẫu nhiên để chọn phần tử cho mẫu. 
-Ưu điểm: Đơn giản nếu có một khung mẫu đầy đủ. 
-Nhược điểm: Khó khả thi khi tổng thể lớn. 
Ví dụ 1. Chọn 100 sinh viên trong 1000 sinh viên. 
Phương pháp chọn mẫu ngẫu nhiên có hệ thống 
Theo phương pháp này, toàn thể đối tượng trong tổng thể được liệt kê theo thứ tự 
định trước. Sau đó tùy vào quy mô mẫu và tổng thể mà quyết định khoảng cách các đối 
được được lựa chọn. Đây là phương pháp sử dụng phổ biến hơn phương pháp ngẫu nhiên 
đơn giản. 
-Ưu điểm: không cần khung mẫu hoàn chỉnh. 
-Nhược điểm: Mẫu sẽ bị lệch khi khung mẫu xếp theo chu kỳ và tần số bằng 
với bước nhảy. 
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Ví dụ 2. Dựa vào danh sách bầu cử tại một thành phó, ta có danh sách theo thứ tự vần của 
tên chủ hộ, bao gồm 240000 hộ. Ta muốn chọn ra một mẫu có 2000 hộ. Vậy khoảng cách 
chọn là: k= 240000/2000 = 120, có nghĩa là cứ cách 120 hộ thì ta chọn một hộ vào mẫu. 
Phương pháp chọn mẫu phân tầng 

Khi mẫu tương đối nhỏ, việc lựa chọn ngẫu nhiên theo hai phương pháp trên có thể 
dẫn tới một số đối tượng có tỷ lệ quá cao hoặc quá thấp trong mẫu. Phương pháp chọn mẫu 
phân tầng giúp giải quyết vấn đề này. Theo phương pháp này, các đối tượng được chia theo 
nhóm. Sau đó đối được được chọn ngẫu nhiên trong từng nhóm theo tỷ tệ tương ứng với 
tổng thể. 
-Phân tầng ngẫu nhiên theo tỷ lệ: Số phần tử trong mỗi tầng tỷ lệ với quy 
mô của mỗi tầng trong tông thê. 
-Phân tầng ngẫu nhiên không theo tỷ lệ: Sử dụng khi độ phân tán các phần 
tử trong mỗi tầng khác nhau đáng kể. Số phần tử trong mỗi tầng được chọn phụ 
thuộc vào độ phân tán của biến quan sát trong các tầng. 
Ví dụ 3. Một tòa soạn báo muốn tiến hành nghiên cứu trên một mẫu 1000 doanh nghiệp 
trên cả nước về sự quan tâm của họ đối với tờ báo nhằm tiếp thị việc đưa thông tin quảng 
cáo trên báo. Tòa soạn có thê căn cứ vào các tiêu thức: vùng địa lý (miền Bắc, miền Trung, 
miền Nam); hình thức sở hữu (quốc doanh, ngoải quốc doanh, công ty 100% vốn nước 
ngoài,...) để quyết định cơ cấu của mẫu nghiên cứu. 
Phương pháp chọn mẫu theo khu vực 

Trong trường hợp mà các nhóm nghiên cứu không có khả năng di chuyển quá nhiều 
để phỏng vấn đối tượng, họ có thể áp dụng phương pháp chọn mẫu theo khu vực. Phương 
pháp này không lựa chọn các đối tượng mà lựa chọn một cách ngẫu nhiên khu vực, sau đó 
phỏng vấn toàn bộ đối tượng trong khu vực. 
Ví dụ 4. Tổng thể chung là sinh viên của một trường đại học. Khi đó ta sẽ lập danh sách 
các lớp chứ không lập danh sách sinh viên, sau đó chọn ra các lớp để điều tra. 
Phương pháp chọn mẫu thuận tiện 

Nhà nghiên cứu có thể chọn những phần tử nào mà họ có thê tiếp cận được. Nói 
cách khác, hình thức chọn mẫu này dựa trên sự thuận tiện hay dựa trên tính dễ tiếp cận của 
đối tượng khảo sát. 
Ví dụ 5. Chọn mẫu n 100 doanh nghiệp bất động sản ở Thành Phố Hồ Chí Minh. Bắt kỳ 
doanh nghiệp nào ở Thành Phố Hồ Chí Minh thuộc bất động sản và đồng ý tham gia vào 
mẫu đều có thể được chọn. 
Phương pháp chọn mẫu phán đoán 
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Phương pháp chọn mẫu theo phán đoán là phương pháp mà người phỏng vấn là 
người tự đưa ra phán đoán về đối tượng cần chọn vào mẫu. Như vậy tính đại diện của mẫu 
phụ thuộc nhiều vào kinh nghiệm và sự hiểu biết của người tổ chức việc điều tra và cả 
người đi thu thập dữ liệu. 

Ví dụ 6. Nhân viên phỏng vấn được yêu cầu đến các trung tâm thương mại chọn các phụ 
nữ ăn mặc sang trọng để phỏng vấn. Như vậy không có tiêu chuẩn cụ thê “thế nào là sang 
trọng” mà hoàn toàn dựa vào phán đoán để chọn ra người cần phỏng vấn. 
Phương pháp chọn mẫu theo lớp 

- _ Dựa vào một số thuộc tính kiểm soát xác định một số phần tử sao cho chúng đảm 
bảo tỷ lệ của tổng thể và các đặc trưng kiểm soát. 

- _ Sử dụng phổ biến nhất trong thực tiễn nghiên cứu. 

- __ Có thể dùng một hoặc nhiều thuộc tính kiểm soát như tuổi, giới tính, thu nhập, loại 
hình doanh nghiệp,... 
Ví dụ 7. Chọn 200 hộ trong 1000 hộ ở các huyện như sau 


Huyện | Số hộ trong mỗi lớp | Cỡ mẫu 
A 250 50 
B 150 30 
C 400 S0 
D 200 40 
Tổng 1000 200 


Bảng 2.1. Thông kê lây mẫu theo lớp. 


2.4. Thiết kế bảng khảo sát 
2.4.1. Những bước chính khi thiết kế bảng khảo sát 
Bảng khảo sát là tập hợp các câu hỏi được trình bày theo một trình tự nhất định để 

người được hỏi trả lời đễ dàng và chính xác. Khi tiến hành thiết kế bảng khảo sát, người 
nghiên cứu cần phải trải qua 7 bước chính sau: 
Bước 1. Xác định thông tin cần thu thập 
Làm thế nào để xác định đầy đủ và chỉ tiết các thông tin cần thu thập Khi 
thiết kế bảng câu hỏi phải dựa vào: 

- Dựa vào vấn đề nghiên cứu. 

- Dựa vào nhu cầu thông tin. 

- Dựa vào khung lý thuyết. 
Bước 2. Xác định phương pháp phỏng vẫn 
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Có ba phương pháp phỏng vấn chính: phỏng vấn trực diện, phỏng vấn qua điện 
thoại, và phỏng vấn bằng cách gửi thư/email/câu hỏi điện tử. Đối với mỗi phương pháp 
khác nhau người nghiên cứu sẽ xây dựng cấu trúc bảng câu hỏi khác nhau. 

Bước 3. Xác định nội dung câu hỏi 
Nội dung các câu hỏi thường xoay quanh việc thu thập thông tin về: 
-Các sự kiện thực tế. 
-Kiến thức của đối tượng được hỏi. 
-Ý kiến thái độ của người đó. 
-Một số dữ liệu căn bản về cá nhân đối tượng nghiên cứu đề phân lọai, thông 
tin liên lạc, và tìm kiếm các biến số liên quan. 
Bước 4. Xác định hình thức câu trả lời Trả 
lời cho các câu hỏi đóng, gồm các dạng: 
-Chọn một trong nhiều lựa chọn. 
-Chọn nhiều lựa chọn. 
- Xếp theo thứ tự. 
Trả lời cho các câu hỏi mở 
-Câu hỏi trả lời tự do. 
-Câu hỏi có tính chất thăm dò. 
Bước 5Š. Xác định cách sử dụng từ ngữ 
-Nên dùng từ ngữ quen thuộc, tránh dùng tiếng lóng hoặc từ chuyên môn. 
-Nên dùng từ ngữ dễ hiểu, để mọi người ở bất cứ trình độ nào cũng có thê 
hiểu được. 
- Tránh đưa ra câu hỏi dài quá. 
-Tránh đặt câu hỏi mơ hồ, không rõ ràng. 
Bước 6. Xác định trình tự và hình thức bảng câu hỏi Nguyên 
tắc để có bảng câu hỏi đẹp: 
-Mỗi phần nên được trình bày phân biệt (dùng màu giấy khác nhau). 
- Đánh số các câu hỏi theo thứ tự. 
-Mã hóa các phương án trả lời. 
-Sử dụng dạng chữ rộng, rõ ràng. 
-Đừng để các câu hỏi bị ngắt khi sang trang mới. 
-Đưa ra các hướng dẫn cụ thê cho bảng hỏi nếu cần, tiếp đó là câu hỏi. 
-Phân biệt giữa hướng dẫn với câu hỏi. 
Bước 7. Phỏng vấn thử và hoàn thiện bảng câu hồi 


Câu hỏi đánh giá được nội dung theo mục đích đưa ra cho nó. 
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-Tất cả đều hiểu được câu hỏi và hiểu theo nghĩa giống nhau. 
-Các hướng dẫn dễ hiều hoặc dễ theo dõi. 
- Liệu đã đưa ra hết các câu trả lời cho vẫn đề chưa? 
-Có thiếu câu hỏi nào một cách hệ thống/thường xuyên không? 
-Kiểm tra các lỗi kỹ thuật cơ bản. 
2.4.2. Những chú ý khi thiết kế từng câu hỏi 
Cơ sở quan trọng khi xây dựng câu hỏi 
Hai yếu tố cực kỳ quan trọng cần nắm rõ trước khi nghiên cứu: 
Thứ nhất là đặc điểm của đối tượng, ví dụ trình độ học vấn, văn hóa, điều kiện kinh tế, độ 
tuổi,... Câu hỏi cần phủ hợp với đặc điểm của đối tượng đề đối tượng có thể và muốn trả 
lời. 
Thứ hai là thông tin cần thu thập theo khung nghiên cứu. Thông tin cần thu thập là gốc đề 
đặt câu hỏi. Tuy nhiên, câu hỏi không nhất thiết hỏi thắng vào thông tin cần mà phải hỏi 
những thông tin mà đối tượng có thể trả lời. 
Các loại câu hỏi 
a. Phân theo hình thức, có câu hỏi đóng, câu hỏi có nhiều lựa chọn và 
câu hỏi mở 
Câu hỏi đóng đơn giản: là dạng câu hỏi chỉ có hai thái cực trả lời như “Có”/ “Không”, 
“Đúng”/ “Sal”,... 
Câu hỏi có lựa chọn định sẵn và đối tượng có thể chọn nhiều phương án phù hợp: Đây là 
một dạng khác của câu hỏi đóng đơn giản khi bản thân mỗi phương án là một câu hỏi 
đóng. 
Câu hỏi có lựa chọn định sẵn nhưng chỉ chọn một phương án. 
Câu hỏi mở: Dạng câu hỏi này không có các phương án để lựa chọn mà đối tượng có thể 
điền câu trả lời theo ý của mình. Câu hỏi mở được sử dụng hạn chế trong khảo sát định 
lượng vì sẽ mất công mã hóa. 
b. Phân theo nội dung, câu hỏi có thể chia làm ba loại 
- Câu hỏi về thông tin khách quan. 
- Câu hỏi về hành vi hoặc trải nghiệm cụ thê. 
- Câu hỏi về cảm nhận, thái độ và đánh giá của đối tượng. 
2.4.3. Những chú ý khi thiết kế tổng thể bảng câu hồi 
Thiết kế tổng thê bảng câu hỏi cũng là một công đoạn quan trọng đề đảm bảo đối 
tượng muốn trả lời bảng câu hỏi. Có một số kinh nghiệm khi thiết kế bảng câu hỏi như 
sau 
Hình thức 
Bảng câu hỏi cần được trình bày cần thận, đễ nhìn và nhất quán. Việc thiết kế cũng 


đảm bảo thuận lợi cho đôi tượng lựa chọn và điên câu trả lời. 
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Giới thiệu 

Bảng câu hỏi nên có phần giới thiệu hoặc thư giới thiệu đính kèm. Phần giới 
thiệu cần nêu mục đích cuộc khảo sát (không nhất thiết phải quá cụ thể - nên dừng ở 
mức mà đối tượng quan tâm). Phần này cũng nên khẳng định việc bảo mật danh tính 
người trả lời và cung cấp địa chỉ liên hệ của nhóm nghiên cứu. 
Các câu hỏi cơ bản 

Có thể phân chia câu hỏi theo các phần để đối tượng dễ trả lời. Nên bắt đầu bằng 
những phần dễ trả lời, ít nhạy cảm. 

Trong một số trường hợp đối tượng trả lời có thể bỏ qua một số câu hỏi. Khi đó, 
việc hướng dẫn chuyền câu hỏi cần được ghi rõ ràng (ví dụ: Nếu trả lời “Không”, chuyển 
sang câu 10). 

Khi có các câu hỏi nhạy cảm, nên đan xen với những câu hỏi ít nhạy cảm hơn. 

Ưu tiên các câu hỏi về thông tin khách hàng, sau đó đến câu hỏi về trải nghiệm 
và hành vi. Các câu hỏi về cảm nhận và đánh giá có ưu tiên thấp hơn, trừ khi chính cảm 
nhận và đánh giá của đối tượng là mục tiêu cần nghiên cứu. 
Các câu hỏi theo nhóm 

Các câu hỏi phân nhóm thường là đặc điểm của đối tượng trả lời (Cá nhân, hộ 
gia đình, doanh nghiệp,...). Các thông tin này dùng để phân nhóm, so sánh nhóm và để 
kiểm soát khi sử dụng các mô hình kiểm định thống kê. 
Độ dài bảng câu hỏi 

Độ dài bảng câu hỏi phụ thuộc vào hai yếu tố cơ bản: thông tin cần thu thập và 
nguồn lực của đề tài. Một bảng câu hỏi quá dài thường khó thuyết phục các đối tượng 
trả lời. Ngược lại, một bảng câu hỏi quá ngắn có thê không thu thập đủ thông tin cần 
thiết. Khi không có lợi ích đi kèm (ví dụ : quà tặng), một đối tượng có thể chỉ sẵn sàng 
dành 20 — 25 phút đề trả lời bảng câu hỏi. 
2.4.4. Xây dựng và thực hiện quy trình khảo sát 

Sau khi xác định mẫu khảo sát và xây dựng bảng khảo sát, bước tiếp theo là xác 
định quy trình khảo sát để đảm bảo thu thập được thông tin với độ tin cậy cao. 

Đối với khảo sát qua thư, quy trình như sau: 

Kiểm tra lại địa chỉ liên hệ của đối tượng. 

Tiến hành gởi thư tới các đối tượng. 

Gọi điện thông báo trước. 
Gửi thư cảm ơn. 
Đối với khảo sát bằng phương pháp phỏng vấn, quy trình như sau: 
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Tập huấn cho các bộ phỏng vấn: Phỏng vấn trực tiếp đòi hỏi có nhiều người cùng 
tham gia cùng phỏng vấn. Các cán bộ phỏng vấn cần thực hiện đúng quy trình phỏng vấn 
một cách nhất quán. 

Gọi điện liên hệ và hẹn thời gian phỏng vấn. 

Tiến hành phỏng vấn: Nhóm nghiên cứu cần đảm bảo địa điểm phỏng vấn thuận lợi 
cho việc trả lời một cách khách quan. 

Giám sát và đảm bảo chất lượng. 

2.4.5. Quy trình chuẩn bị số liệu 
Nhập liệu 

Công đoạn này cần thiết đối với phương pháp thu thập qua thư hoặc phỏng vấn trực 
tiếp bằng phiếu giấy. Cần lưu ý: 

-Mỗi dòng được dành cho một quan sát (thường là một phiếu). 

-Mỗi cột là một trường dữ liệu. 

-Mỗi phiếu câu hỏi gán một mã. 

-Nhập dữ liệu theo trình tự câu hỏi và trung thành với giá trị trong bảng câu 
hỏi. 

Không tiến hành điều chỉnh khi nhập số liệu trừ khi nhận rõ sai sót khi nhập số liệu. 

-Nhập phiếu hai lần độc lập. 

-File đữ liệu có thể được kiểm tra bằng các lệnh tần suất đơn giản. Nếu có 
các giá trị nằm ngoài khoảng cho phép hoặc đáng ngờ thì nhóm nghiên cứu có thể 
đối chiếu lại với phiếu câu hỏi. 

Kiểm định các thước đo 

Các biến số về thái độ, hành vi, hay cảm nhận thường được đo lường bằng một 
số câu hỏi hoặc mệnh đề. Kê cả khi những thước đo được kiểm định cân thận ở những 
nghiên cứu trước đó, đối với mỗi cuộc khảo sát, những thước đo này vẫn cần được kiểm 
tra về độ tin cậy. 

- Phân tích nhân tố (factor analysis) : Phân tích nhân tố chính là 
việc kiểm tra xem các mệnh đề/câu hỏi có thực sự nhóm lại với nhau thành 
thước đo như trong lý thuyết hay không. Với các khảo sát khác nhau, có 
thể một số mệnh đề không vào cùng nhóm với các mệnh đề khác. Khi đó 
nhóm nghiên cứu cần tiếp tục kiêm tra độ tin cậy đề ra quyết định. 

-_ Phân tích độ tin cậy (Reliability analysis) : Phân tích độ tin cậy là 
xem các mệnh đề có thực sự “thống nhất” với nhau để cùng đo lường biến 
số cần đo hay không. Chỉ số đo lường sự thống nhất này là Cronbach's 
alpha. Chỉ số này tốt là từ 0,7 trở lên và tối thiêu cần đạt là 0,63 (D° Vellis, 
1990). 
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Các phần mềm thống kê có thê giúp thực hiện hai phép phân tích này khá nhanh 
chóng và đễ dàng. Bạn đọc có thê tìm hiểu kỹ thuật phân tích nhân tố ở các sách vở viết 
về thống kê toán. 
2.4.6. Câu hỏi thảo luận 
Câu hỏi 1. Nghiên cứu khảo sát là gì? Khi nào ta cần áp dụng nghiên cứu khảo sát? 
Nêu một ví dụ áp dụng phương pháp khảo sát? 
Câu hỏi 2. Khi thiết kế khảo sát cần lưu ý những vấn đề gì? Nêu những hạn chế của 
phương pháp khảo sát? 
Câu hỏi 3. Mẫu khảo sát cần đảm bảo yêu cầu gì? Yếu tố nào ảnh hưởng tới tính đại 
diện của mẫu. 
Câu hỏi 4. Hãy nêu các phương pháp chọn mẫu? Phương pháp khảo sát nên chọn 
phương pháp chọn mẫu nào? 
Câu hỏi 5. Trình bày phương pháp lấy mẫu theo xác suất? cho ví dụ minh họa. 
Câu hỏi 6. Những loại nghiên cứu nào thì sử dụng phương pháp khảo sát? 
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Chương 3 
KIÊM ĐỊNH GIÁ THUYÉẾT NGHIÊN CỨU 


3.1. Một số khái niệm 

Giả thuyết thống kê là những phát biểu về các tham số, quy luật phân phối, hoặc tính độc 
lập của các đại lượng ngẫu nhiên. Việc tìm ra kết luận để bác bỏ hay chấp nhận một giả 
thuyết được gọi là kiểm định thống kê. 

Mục đích của kiểm định giả thuyết là để rút ra kết luận về các tham số của tổng thể từ kết 
quả quan sát của mẫu được chọn ngẫu nhiên. 

Phương pháp kiểm định: Thứ nhất là đưa ra cặp giả thiết đối gồm giả thiết không (Null 
Hypothesis) Họ và giả thiết đối H¡. Thứ hai là chọn một kiểm định thống kê để đánh giá 
giả thiết không Hạ. 

3.2. Kiểm định Chi-square 


Hai biến định tính 
trong tổng thê có 
mối quan hệ với 

nhau hay không? 


Hai biên định tính 
trong mẫu có môi 
quan hệ với nhau 


Giả sử hai biến định tính trong mẫu có mối quan hệ với nhau, ta muốn kiểm định xem hai 
biến định tính này có mối quan hệ với nhau trong tông thể hay không. Khi đó, ta thực hiện 
kiểm định Chi-square. 
Cặp giả thiết: 

Họ: Hai biến độc lập với nhau 

H:: Hai biến có liên hệ với nhau 
Tiêu chuẩn kiểm định: 
- Nếu sig. < 0.05 thì ta bác bỏ giả thiết Họ với độ tin cậy 95%. Ngược lại, ta chấp nhận giả 
thiết Họ với độ tin cậy 95%. 
Ví dụ minh họa: (file Døfa£huchanh.sav) 
Với mẫu gồm 500 quan sát, dựa vào bảng kết hợp hai biến định tính đưới đây (Cách thức 
đọc báo nói chung và trình độ học vấn), ta thấy rằng nhóm người có trình độ học vẫn cao 
có xu hướng đọc báo theo cách “Xem lướt qua các đề mục, đọc các mục ưa thích trước”. 
Nhóm người có trình độ học vấn cấp 1, cấp 2 thì “Chỉ đọc các trang mục ưa thích, ít đọc 
các trang khác”. Như vậy, dựa vào mẫu này, rõ ràng là có mối quan hệ giữa cách thức đọc 
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báo và trình độ học vấn của người đọc. Tuy nhiên, mục tiêu nghiên cứu của chúng ta là 
tổng thể, chứ không phải mẫu, do đó, chúng ta cần thực hiện kiểm định. Trong file 
Datathuchanh.sav, ta tiễn hành kiểm định biến c61 (Cách đọc các tờ báo nói chung) và 
biến nhomhv (Trình độ học vấn) để xem thử hai biến này có mối liên hệ trong tổng thê 
không? 


hlhom hoc van 


Column N % Column N % Count Column 
Cach doc cac to hao noi Doc theo thu tu tu trang 18 Tĩ 1981 
chung dau den trang cuoi 
Xem luot qua cac de muc, 2 .2 621 
doc cac muc ua thich 
truoc 
Chi doc cac trang muc ua 5: 2 Ề q1 


thich, it doc cac trang 
khac 


5=. ...~^5... ˆ + . + . _- 


Thực hiện với SPSS: 
B1: Từ menu, chọn Analyze > Deseriptive Statisties > Crosstabs... Đưa biến c6.I vào ô 


Row(): và đưa biến nhomhv vào ô Column(Qs): 


đạ Crosstabs 


Row(Ss): 
đề c37.2 &› c8.1 
đơn: Le) 
đò c274 
é c375 Column(s): 

(S}: 
4£ tuoi ĩR 
# sonk L*) 
ê› giinh 
é› _ Layer 1 of 1 


đê» tngd 


đê» hocvan —— 1“. 


để› nghe 


fevious Next 
4Ÿ W.TP 
.IẴ TUOI_4N » 
? c2ahnm _ 


Z2 =2¬cnan 


EI is 
B2: Nhắn nút Statistics để chọn kiếm định Chi-square. Nhân Conftinue > OK. 
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ffầ Crosstabs: Statistics 


Í' Chi-square —] Correlat 
Nominal ¡_rOrdinal- 
1 Contingency coefficient _¡ Gamm 
1 Phi and Cramers V [1 Somer: 
1 Lambda — Kendal 
—Ì Uncertainty coefficient ¡—] Kendal 
hlominal by Interval ai Kappa 
_Ì Ha (—] Risk 

—]Ì McNem: 

_Ì Cochran's and Mantel-Haenszel statisti 


Chi-Square Tesfs 


Pearson Chi-Square 19.3383 
Likelihaod Ratio 19.215 
Linsaar-hy-Linear .281 1 
Assonriatian 

h 0fValid Cases 495 


Ta được kết quả như trên. Ta thấy răng, ứng với đại lượng thống kê Pearson Chi-Square thì 
P-value = 0.022 < 0.05 nên ta bác bỏ giả thuyết Họ với độ tin cậy 95%. Trong SPSS, P- 
value chính là Sig. (Observed Sigmificance Level). 

Chú ý rằng kiểm định Chi-square dùng đề kiểm định mối liên hệ giữa hai biến định danh- 
định danh hoặc định danh-thứ bậc. Trong trường hợp hai biến thu thập từ thang đo thứ bậc 
thì thay vì dùng kiểm định Chi-square, chúng ta có thể dùng Tau của Kendall, Gamma 
của Goodman và Kruskal. 

3.3. Kiểm định giả thuyết về giá trị trung bình của tổng thể 

Trong thống kê, có các phép kiểm định về giá trị trung bình của tổng thể phô biến sau: 


TT Mục đích kiểm định SPSS 


I_ | So sánh giá trị trung bình của | Analyze > Compare Means > One-Sample T-Test 
một tổng thể với một 1á trỊ cụ 
thể 


2 | So sánh hai giá trị trung bình | Analyze > Compare Means > Independent- 


của hai tổng thê riêng biệt Samples T-Test 
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3 | So sánh hai giá trị trung bình | Analyze > Compare Means > Paired-Samples T- 
của hai tống thể riêng biệt, | Test 

nhưng mỗi quan sát trong tổng 

thể này có sự tương đồng theo 

cặp với một quan sát trong 


tổng thê kia. 


4 | So sánh các giá trị trung bình | Analyze > Compare Means > One-way ANOVA 


của nhiều hơn hai tổng thể 


riêng biệt 


So sánh giá trị trung bình của một tông thể với một giá trị cụ thể 

Tình huống: Có người cho rằng tuổi trung bình của độc giả báo Sài Gòn Tiếp thị (SGTT) 
là 30 tuổi. Vỡi đữ liệu có được trên file Dafafhuchanh.sav. Bạn làm thế nào đề kiểm định 
giả thuyết này? 

Cách thức kiểm định: 

B1: Đặt giả thuyết Họ: Tuổi trung bình của độc giả báo Sài Gòn Tiếp thị = 30 

B2: Dùng lệnh Transform -> Count values within cases để chuyên các biến Category từ 
c2a.I đến ca2.9 thành biến Diehotomy tên là đocS$GŒTT với biểu hiện 1 nếu là người có 
đọc báo SGTT và biểu hiện 0 nếu là người không đọc báo SGTTT mà đọc các báo khác. 
(Xem hướng dẫn chỉ tiết trong file Chủ đề 2 HD Category thanh Dichotomy.doc) 

B3: Dùng lệnh Seclect Case để lọc ra những trường hợp mà đoeSŒTT nhận giá trị I để 
các lệnh thống kê sau đó của SPSS chỉ thực hiện trên những trường hợp này. 
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ẨÀ Data thuc hanh.sav [DataSet1] - IBM SPSS Statistics Data Editor 
File Edit View Transform Analyze DirectiMarketing Graphs UHiities Addons Window Halp 


ị =. _N= —Ý  Í~1 Define Variable Properties.. 
ñ = 


k? Set Measurement Level for Unknown... 


mm: _—— 
[_H& — ] sonk ầ Copy Data Properties... nã H P None B 
_— 147  ¡ gtnh| EÈ NewCustomAtribute... : ({LNam).. 'N 
_— 148  j|tacn| f3 DefñneDates.. ù nhaâ ù {l,Khoâng.. N 
—H— tnzd EEl Define Multiple Response Sets... ù .{1,Döôùi 2t. 6 
150 | hoevs — |do hoc vanvaá 1,Caáp 1}... N 
| 0CV: Validation , lo : vanvaán {1, Caáp 1} 
BZ..=.a...,.......” nghiep {I,Cong ch... N 
[1 | WIPp. EE Identify Duplicate Cases... None N 
— 153  |TUOI FEjldenifyUnusualCases.. ơi (1825). N 
(194  jnhom| 3 SortCases.. hoc van ({1,Cap 1-2}... N 
| 153 | c2ahrÌ EẨsonvaraples.. HNM None kụ 
L__16 _| c2asg BR Transposo.. SGGP None ỊN 
c2ald Pađtd ¬- None N 
L— 158 — | e2am Note GGG NLD None N 
D15221c2ap Restructure... TP 'None N 
Í 160  |c2ata| EBiAggregate.. TN None N 
=. c2att Orthogonal Design } |cTT None N 
| =— —BTT=1 ŒITER N 
= N— Split Eile... _——, 
mm. TT {0, Khong đ... 
165 — 
fF Select Cases .. . 
Ï Select 
© All cases 
\- gang (®) lf condition is satisfied 
đây ginh condition is satisfie 
lh> CGRGÓ) ssem-› 
` tngd © Random sample of cases 
hoœan CEENNGh 
Sample... 
& nghe | &ample... 
4 WTP ©) Based on time or case range 
n = 
© Use filter variable: 
4# c2ahnm 
ˆ c2asggp ` | 


4# c2ald 


® c2anld 


Output 
(®) Filter out unselected cases 


© Copy selected cases to a new datas 
Dataset name: 


© Delete unselected cases 
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B4: Trên menu, chọn Analyze > Compare Means > One-Sample T-Test. Trên hộp thoại 
One-Sample T-Test, đưa biến tuoi vào khung Test variable, khai báo Test Value là 30. 
Nhấn nút Options... để chọn độ tin cậy. 

tạ One-Sample T Test 


Test Variable(s): 


@ tuoi 


Tastaliie- Í¬n | 


Nhấn nút Continue > OK. Ta nhận được bảng kết quả sau: 


“* T-Test 
[DataSetl] D:\Thanh Phuong\SPSS SV\Data thuc hanh.sav 


One-Sample Stafistics 


Std. Error 
ll) Mean Std. Daviatinn Mean 


One-Sample Test 


Test Value = 30 
88% Confide 


Theo mẫu này (N = 159), tuổi trung bình của các độc giả SGTT là 32.79 tuổi. Mức ý nghĩa 
của kiểm định Sig. = 0.001 < 0.01, đo đó ta bác bỏ giả thuyết Ho với độ tin cậy 99%. 
2.786 = Mean Difference = Mean của mẫu (32.79) — Mean giả thuyết (30) 
0.65 < Mean Difference < 4.92 với độ tin cậy 99%, 
Do đó, ta có thể khẳng định tuổi trung bình của những người thường xuyên đọc báo Sài 
Gòn Tiếp thị là trên 30 tuổi. 
So sánh hai giá trị trung bình của hai tổng thể riêng biệt-Trường hợp mẫu độc lập 
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Tình huống: Cần so sánh về số nhân khẩu trung bình của hộ gia đình giữa hai thành phố 
Hà Nội và Thành phố Hồ Chí Minh. Với đữ liệu có được trên file Dafathuchanh.say. Bạn 
làm thế nào đề thực hiện điều này? 
Phân tích tình huống: Trong tình huống này, bạn có một biến định lượng là sonk và một 
biến định tính là íp. Từ thông tin của hai mẫu độc lập, bạn sẽ sử dụng kiểm định sự bằng 
nhau về giá trị trung bình của hai tổng thể có phân phối chuẩn và phương sai bằng nhau. 
Từ đây về sau, ta gọi tắt là kiểm định trung bình hai mẫu độc lập (Independent-Samples T- 
Test). Nếu kiểm định giả thuyết về giá trị trung bình của hai mẫu độc lập vi phạm giả định 
là hai mẫu được lẫy ngẫu nhiên từ hai tổng thể có phân phối chuẩn thì chúng ta phải thực 
hiện một phương pháp kiêm định khác tên là Mann-Whitney. 

Trước khi thực hiện kiểm định trung bình, ta cần thực hiện kiểm định sự bằng 
nhau của hai phương sai tổng thể. Kiểm định này có tên là Levene Test. 
Cách thức kiểm định: 
BI: Đặt giả thuyết Họ: Số nhân khẩu trung bình của hộ gia đình tại hai thành phố là bằng 
nhau. 
B2: Trên menu, chọn Analyze > Compare Means > Independent-Samples T-Test. Trong 
hộp thoại, chọn biến định lượng sonk vào mục Test Varlable(s):. Chọn biến định tính fp 


vào mục Grouping Varlable: 


tạ Independent-Samples T Test ” 
———— ”— 
Test Variable(s): 
42 st 2 sonk 
di c1 
đề c2a1 
đề» c2a2 buá 
để» c2a3 
đề c2a4 
é c2a5 Grouping Variable: 
-_m L*) 
đề) c2a7 
ÑØ ~n¬~¬n — Ttnfinna /Y*rnaitin=o 


Sau khi chọn biến định tính để phân nhóm, nhắn nút Define Groups... để chỉ định hai 
nhóm cần so sánh với nhau. Trong hộp thoại Defñne Groups..., gõ mã số của hai nhóm cần 


so sánh. 


28 


đạ Independent-Samples T Test 


đạ Define Groups 


 stt 
dŸ c1 


đê» c2a1 (' Use specified values 


¬ em Group 
để› c2a5 © Cut point 


đề› c2a6 
C-E©i (emue)_canel j[_ Hap_) 


B3: Nhắn nút Continue > OK. Ta nhận được bảng kết quả sau: 


® T-Test 


[DataSetl] D:\Thanh Phuong\SPSS S5V\Data thuc hanh.sav 


Group Statistics 


Std. Error 
Thanh pho N Std. Deviatian Mean 


So nhan khau Ha Noi 250 4.29 1.887 .105 
TPHCM 250 5.33 2.715 172 


Independent Samples Test 
Levene's Test far Equality of 
Variances test for Equality of Means 
Mean Std. Error 
F Sid. li dfí Sia. (2-tailed) Difference Difference 


Dựa vào kết quả kiểm định sự bằng nhau của hai phương sai (Levene°s Test for 
Equality of Varianees), ta sẽ xem xét kết quả của kiểm định t, cụ thể như sau: 

+ Nếu giá trị Sig. trong kiểm định Levene < 0.05 thì phương sai giữa hai thành phố 
khác nhau, ta sẽ sử dụng kết quả kiểm định t ở phần Equal Variances not Assumed. 

+ Ngược lại, nếu giá trị Sig. trong kiểm định Levene >= 0.05 thì phương sai giữa 
hai thành phố không khác nhau, ta sẽ sử dụng kết quả kiểm định t ở phần Equal Variances 
Assumed. 

Với kết quả kiểm định về sự bằng nhau của hai phương sai ở bảng trên, ta bác bỏ 
giả thuyết Họ về sự bằng nhau của hai phương sai. Do đó, chúng ta sẽ sử dụng kết quả ở 
phần Equal Variances not Assumed cho kiểm định t, cụ thể như sau: 

+ Nếu giá trị Sig. trong kiểm định t < 0.05 thì ta kết luận có sự khác nhau về số 
nhân khâu trung bình của hộ gia đình giữa hai thành phó. 

+ Nếu giá trị Sig. trong kiểm định t >= 0.05 thì ta kết luận chưa có sự khác nhau về 
số nhân khẩu trung bình của hộ gia đình giữa hai thành phố. 


VÀ, 


Trong ví dụ này, vì Sig. < 0.05 nên ta bác bỏ giả thuyết Ho về sự bằng nhau của hai 
trung bình và kết luận số nhân khẩu trung bình trong hộ gia đình ở Thành phố Hồ Chí 
Minh lớn hơn so với ở Hà Nội một cách có ý nghĩa thống kê (5.33 > 4.29). 

So sánh hai giá trị trung bình của hai tổng thể riêng biệt, nhưng mỗi quan sát trong 
tông thể này có sự tương đồng theo cặp với một quan sát trong tông thể kia (Paired- 
Samples T-Tesf) 


đà Dau phong.sav [DataSet2] - IBM SPSS Statistics Data Editor 
File Edit View Data Transform Analyze Directl 


2NHB l - x Šj 


1d | spban spthu 
1 1 f) 
SE 2 § 
3 3 6 
_ 4 § 
3 3 7 
_— 6 6 1 
1 1 1 
§ § 6 
9 9 § 
10 10 6 
11 1 7 
12 12 L 
13 13 
14 14 ọ 
15 15 1 


Tình huống: Một công ty chế biến thực phâm cần kiểm định điểm đánh giá trung bình của 
người tiêu dùng về đậu phộng khi chưa được cải tiến và khi đã được cải tiến. Vỡi dữ liệu 
có được trên file Dauphong.sav. Bạn làm thế nào để kiểm định giả thuyết này? 

Cách thức kiểm định: 

B1: Đặt giả thuyết Họ: Không có sự khác nhau về điểm trung bình tổng thể 

B2: Trên menu, chọn Analyze > Compare Means > Paired-Sample T-Test. Chọn hai biến 


spban và spfhu vào mục Paired Variables: 
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f3 Paired-Samples T Test 


Paired Variables: 


riÑ id Variable1 Variable2 
di spban 
.[Ÿ spthu 
2 
b 
c 


B3: Nhắn nút Continue > OK. Ta nhận được bảng kết quả sau: 


* T-Test 
[DataSet2] D:\Thanh Phuong\SPSS SV\Dau phong. sav 


Paired Samples Statistics 


Std. Error 
Mean N Std. Deviatian Mean 
Pair1 san pham dang han 7.20 20 .834 .186 
san pham cai tien 7.80 20 1.399 .313 


Paired Samples Correlafions 


| NÓ |Comaaion | Sg —| 


Pair1 san pham dang ban & 20 533 .18 
san pham cai tien 


Paired Samples Test 


Pairedl Differances 


Trong bảng cuối cùng, vì Sig. = 0.36 < 0.05 nên có thể kết luận rằng có sự chênh lệch có ý 
nghĩa thống kê về sự đánh giá của người tiêu dùng đối với sản phẩm đậu phộng trước và 
sau khi cải tiễn. Cụ thể là sản phẩm sau khi cải tiến được đánh giá cao hơn sản phẩm trước 
cải tiến, trung bình khoảng 0.6 điểm. 
3.4. Phân tích phương sai một yếu tố (Analysis of Varianee-ANOVA) 
Phân tích phương sai là sự mở rộng của kiêm định t vì phương pháp này giúp ta so sánh 
giá trị trung bình của 3 nhóm trở lên. Sau đây là một số giả định đối với phân tích phương 
sai một yếu tố: 

+ Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên. 

+ Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được 


xem như tiệm cận phân phôi chuân. 
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+ Phương sai của các nhóm so sánh phải đồng nhất. 
Nếu giả định tổng thể có phân phối chuẩn với phương sai bằng nhau không được đáp ứng 
thì kiểm định phi tham số Kruskal-Wallis sẽ là một giải pháp thay thể hữu hiệu cho 
ANOVA. 
3.5. Phân tích tình huống và cách thức thực hiện trên SPSS 
Tình huống: Có sự khác biệt hay không về mức độ đánh giá tầm quan trọng của yếu tố 


2¬? 


“có tự do cá nhân” đối với cuộc sống của một con người giữa những người có trình độ học 
vấn khác nhau. Biết rằng 

+ Biến định lượng c36.6 được xác định bởi thang đo định lượng 7 mức độ (1: không quan 
trọng, 7: rất quan trọng) 

+ Biến định tính ø0øznhv (1: cấp 1-2, 2: cấp 3-THCN, 3: CĐ-SVĐH, 4: Tốt nghiệp ĐH) 
Với đữ liệu có được trên file Dafathuehanh.sav. Bạn làm thế nào đề kiểm định giả thuyết 
này? 

Cách thức kiểm định: 

BI: Đặt giả thuyết Ho: Không có sự khác biệt về mức độ đánh giá tầm quan trọng của yếu 


x5 


tố “có tự do cá nhân giữa các nhóm trình độ học vẫn 
B2: Trên menu, chọn Analyze > Compare Means > One-way ANOVA. Đưa biến định 


lượng vào mục Dependent List và đưa biến phân loại vào khung Faetor. 


đà One-Way ANOVA « 


Dependent List: 


‹° c36.6 


ciŸ TUOI_4N 
4Ÿ c2ahnm 
Ÿ c2asggp 


@ c2ald 


B3: Chọn nút Options... 
Deseriptive: Tính các đại lượng thống kê mô tả chỉ tiết cho từng nhóm được phân tách đề 


so sánh. 


Homogeneity-of-variance: Kiêm định sự băng nhau của các phương sai nhóm. 


đồ One-Way ANOVA: Optiona  “Ì 


Statistics 


 Descriptive 

L_] Fixed and random effects 

v Homogeneity of variance test 
ˆ_1 Brown-Forsythe 

—] Welch 


-_] Means plot 


Mlissinq Values 


(®) Exclude cases analysis by ana 
(ÁN FvalhisziA^ ^¬nan^¬ li¬^haä¬^¬ 


Nhấn nút Continue > OK. Ta có các bảng kết quả sau: 
*% Oneway 


[DataSetl] D:\Thanh Phuong\SPSS SV\Data thuc hanh.sav 


Descriptives 


Co tu do ca nhan 


85% Confidence Interval far 
Mlean 
Std. Deviatinn LJpper Bound 


5.43 1.284 
5.18 1.391 


-¬^ 4a mna¬ 


5.77 
5.37 


-~¬n 


Cap 1-2 
Cap 3 


Fan sa. nh 
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"4 


Test of Hormogeneify of Variances 


Co tu da ca nhan 


Lavensa 
Statistic df1 dí2 


S 


RNOVA 


Co tu do ca nhan 


pen Groups 13.488 4.496 
Within (web: 883.413 491 1.882 
Bảng thứ nhất cho thông tin về các đại lượng thống kê mô tả cho từng nhóm và cho toàn 


bộ mẫu nghiên cứu. 
Bảng thứ hai cho biết kiểm định phương sai. Với Sig. = 0.258 có thể nói phương sai của sự 


Ã cc 


đánh giá tầm quan trọng của yếu tố “có sự tự do cá nhân” giữa 4 nhóm học vấn không khác 
nhau một cách có ý nghĩa thống kê. Như vậy, kết quả phân tích ANOVA ở bảng thứ ba 
được sử dụng tốt. Ở bảng thứ ba, với SIg. = 0.077, nếu chọn độ tin cậy của kiểm định là 90 
% thì có thể nói có sự khác biệt có ý nghĩa thống kê về sự đánh giá tầm quan trọng của yêu 
tố “có sự tự do cá nhân” giữa 4 nhóm học vấn (0.077 < 0.1). Nếu chọn độ tin cậy của kiểm 
định là 95 % thì có thể nói không có sự khác biệt có ý nghĩa thống kê về sự đánh giá tầm 
quan trọng của yếu tô “có sự tự do cá nhân” giữa 4 nhóm học vấn (0.077 > 0.05). 

3.5.1. Xác định chỗ khác biệt (Phân tích sâu ANOVA) 

Việc tiếp theo là chúng ta cần tìm xem sự đánh giá này là khác biệt giữa các nhóm 
học vấn nào. Có hai phương pháp để xá định sự khác biệt trong các giá trị trung bình nhóm 
xảy ra ở đâu, đó là kiểm định “trước” và kiểm định “sau”. 

+ Kiểm định “trước” có thể định nghĩa như là kiểm định các giả định về sự khác 
nhau của các trung bình nhóm trước khi thực hiện phân tích ANOVA. Lúc này ta thực hiện 
việc xác định những chênh lệch cụ thể giữa các trung bình nhóm theo phán đoán chủ quan 
của ta. Kiểm định này được thực hiện trong hộp thoại Contrasts với tên gọi là kiểm định 
Priori Contrasts. 


: 
Fầ One-Way ANOVA * 


Dependent List 


£ c36.6 


ciÑ TUOI_4N 

@ c2ahnm 

£Ÿ c2asggp Factor: 

# c2ald k4 [«] Fe nhnmmh+ | 
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+ Kiểm định “sau” có thể định nghĩa như là kiểm định các giả định về sự khác nhau 
của các trung bình nhóm sau khi thực hiện phân tích ANOVA. Kiểm định này được thực 
hiện trong hộp thoại Post Hoc. Sau khi nhắn Post Hoc, ta có hộp thoại sau: 


tạ One-Way ANOVA: Post Hoc Multiple Comparisons “@ 


Equal Variances Assumed 
| LSD Ì 8N — | Waller-Duncan 
— | Bonferroni 1 Tukey Type I/Type II Error F 
¡| 8idak 1 Tukeys-b (#' Dunnett 
F—] Scheffe F-] Duncan Control Category : [Last 
_I¡R-E-G-WF  l HochbergsGT2 Test 
'] R-E-Ge-wq ï] Gabriel () 2-sided (© < Control 


FEqual Variances Not Assumed 
_|¡TamhanesT2 | DunnetfsT3 ' Games-Howell  ' Dunnet 


Trong ví dụ này, ta thử chọn kiểm định Dunnett với lựa chọn mặc định là nhóm cuối cùng. 


Sau đó nhắn nút Continue > OK. Ta được bảng kết quả sau: 


Post Hoc Tests 


Muttiple Cormnparisons 


Dependsnt Variahla: Co †u do ca nhan 
Dunnett t (2-sided)'* 


_ Mean 90% Co 
Diffarence (l- 
Nhom hoc van _ (J) Nhom hoc van J) Std. Error T— Lower Bou 


f*nm.€/mH Tn† nnhian HH 183 
Dựa vào bảng kết quả trên, ta thấy có sự khác biệt c có ý Tô nrÊn thống kê giữa th có trình 


độ học vấn cấp 1-2 và nhóm đã tốt nghiệp Đại học vì Sig. = 0.077 < 0.1. 
3.5.2. Phân tích phương sai hai yếu tố (Two-way ANOVA) 
Œile Phan tích phuong sai 2 yeH fo.SaV) 
Sau đây là một số giả định đối với phân tích phương sai hai yếu tố: 
Em) 


+ Tổng thê có phân phối chuẩn. 

+ Phương sai của các nhóm so sánh phải đồng nhất. 

Tình huống: Xét ảnh hưởng của mức độ yêu thích ngành học và thời gian tự học đến kết 
quả học tập của sinh viên. 

Cách thức kiểm định: 

B1: Đặt các giả thuyết Họ cho tình huống này như sau: 

+ Điểm trung bình (ĐTB) của sinh viên có thời gian tự học khác nhau đều bằng 
nhau. 

+ ĐTB của SV có mức độ yêu thích ngành đang học khác nhau đều bằng nhau. 

+ Không có ảnh hưởng tương tác giữa thời gian tự học và mức độ yêu thích ngành 
đang học của SV. Một cách cụ thể là, ảnh hưởng của thời gian tự học đến ĐTB là như nhau 
đối với các nhóm sinh viên có mức độ yêu thích ngành đang học khác nhau, và ảnh hưởng 
của mức độ yêu thích ngành đang học đến ĐTB là như nhau đối với các nhóm sinh viên có 
thời gian tự học khác nhau. 

B2: Trên menu, chọn Analyze > General Linear Model > Univarlate. Đưa biến điemtb vào 


mục Dependent Variable và đưa hai biến yeu/hich va íuxhoc vào khung Fixed Faetor(). 
tạ Univariate 


Dependent Variable: 
* | diemb 


Eixed Factor(s): 
‹# yeuthich 
E3 ⁄? tuhoc 


Random Factor(s): 


Covariate(s): 


B3: Chọn nút Options... 
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đồ Univariate: Options 


rEstimated llarginal lleans 


Factor(s) and Factor Interactions: Display Means for: 


yeuthich*tuhoc 
IÑ Compare main : 
Confidence interval 
LSD(none 
rFDisplay 

'# Descriptive statistics (w#' Homogeneity tests 

w Estimates of effect size IEI Spread vs. level plof 

I/ Observed power _ ¡ Residual plot 

__¡ Parameter estimates ¡1 Lack of fit 

CC SẺ TUC ST CS SỈ 22 CC m1 ha--.-—.—- >- G1, SS2.S CS. DC 


Nhấn nút Continue > OK. Ta có các bảng kết quả sau: 


*®% Univariate Analysis of Variance 


[DataSetl] D:\Thanh Phuong\SPSS SV\Phan tich phuong sai 


Between-Subjects Facftors 


| VausLabl | N —_ 


yveuthch 1 khong thich 24 
lam 
thich 21 
rat thich 21 
tuhoc †1 li 21 
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Descriptive Statistics 


Dependsnt Variahle: diermth 

Lauhlt-——— thục — | Men Std. Deviation 

khong thichlam  ¡† .38483 
trung hinh .,a42 .28387 
nhieu tà .29277 
Total .82 .378688 
li .35989 
trung hinh : .28439 
nhieu : .25448 
Total : .58531 

rat thich li 2 .51547 
trung hinh : .3/353 
nhieu : .35989 
Total : ./9705 


Levene's Test of Equality of Error 
Variances 


Dependsnt Variahla: diamth 


đít d2 | Sự | 
1441| 8| 54 | 182] 
Tests the null hypothesis that the error 
variance of the dapenrdent variahle is aqual 
acroSS gr0ups. 
a. Dasian: Intercept + yeuthich + tuhac 
hb jaasb,.2u THHRE 


Tests of Between-Subjects Effects 


Dependsnt Variahla: diamth 


20.414 


Corrected Model 20.3083 2.538 


Intercept† 2500.470 2500.470 | 20110.183 2011 
yeuthich 5.040 2.520 20.287 4 
tuhoc 13.020 6.510 52357 10 


2.246 .5B1 4.515 


yeuthich * tuhoc 
Hai bảng đầu tiên cung cấp thông tin về các số liệu thống kê mô tả của hai mẫu đữ liệu. 
Bảng thứ ba là kết quả kiểm định về sự bằng nhau của phương sai các nhóm. Kết quả kiểm 
định Levene cho thấy giả định phương sai bằng nhau đã không bị vi phạm. Cuối cùng là 
bảng kết quả kiểm định chính, bảng này cho thấy hai nhân tố chính cũng như sự tương tác 
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của chúng đều có ảnh hưởng đến kết quả học tập. Tại mức ý nghĩa 5%, các sig. đều bé hơn 
mức ý nghĩa nên cả ba giả thuyết đặt ra đều bị bác bỏ. Do đó, ta phải tiếp tục phân tích sâu 
ANOVA. Bằng kiểm định Turkey, chúng ta có bảng kết quả sau cho từng tình huống kiểm 
định. 

a. Xác định các cặp trung bình tổng thể khác nhau theo yếu tố nghiên cứu thứ nhất là 
thời gian tự học. 

Trong hộp thoại Univariate chọn Post Hoc ta được hình sau: 


đà Univariate: Post Hoc Multiple Comparisons for Observed Means 


Factor(s): Post Hoc Tests for: 
yeuthich tuhoc 
tuhoc 


E3 


rEqual Variances Àssumed 
LSD ¡ 8N ˆ ¡ Waller-Duncan 
| Bonferroni /# Tukey Type l/Type lI Error Ra 
1 8idak —_¡ Tukeys-b _¡ Dunnett 
“IS§chefe  ' Duncan IC 
E] R-E-G-W-F Í—Ì Hochbergs GT2 rTesi 
E] R-E-G-W-Q [FT] Gabriel ® 2-sided ® <Control ® 


=Emiial 1/arianecae hln‡ Àcciimari 


Đưa biến /„hoc vào ô Post Hoe Tests for và chọn Tukey. Nhắn nút Continue > OK. Ta 


có các bảng kêt quả sau: 


Km) 


Post Hoc Tesfts 


tuhoc 


Multtiple Cornparisons 


Depenrdent Variahle: diemtlh 
Tukey HSD 


_ Mean 95% Conf 

Diffarance (l- 
Iì tuhoac “lì tuhoc dJ) Std. Error Siq. Lawer Bounc 
trung binh -./000 .10882 .000 -.862: 
nhieu -1.1000” .10882 .000 -1.362: 
trung binh ¡it .000 .10882 .000 .837! 
nhieu -.40007 .10882 .002 -.8B2: 
.000 837: 


nhieu lì 1.1000 .10882 


Homogeneous Subsets 


diemtb 


Tukey HSD:®P 
Subhset 


li 


2 5.7000 
trung binh 8.4000 
nhieu 
Sid. 1.000 1.000 


Means for groups in homogeneous subse†s are 

displayed. 

Raserl nn nhserverl maans 
Tất cả cá giá trị Sig. đều bé hơn 0.05 nên ta có thể bác bỏ giả thuyết H0 và kết luận rằng 
sinh viên mà có thời gian tự học khác nhau sẽ có kết quả học tập khác nhau. 
b. Xác định cặp trung bình tông thể khác nhau theo yếu tố thứ hai là mức độ yêu 


thích ngành học 
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Post Hoc Tests_ 


yeuthich 


Multiple Cormparisons 


Dependent Variahlsa: diemth 


Tukey HSD 


Mean ` 
Diffarence (l- 
Iì veuthich J) vauthich J) Std. Error Lower BoL 


khoang thich lam 


thich 


rat thich 


khong thich lam 
thich 
rat thich 


Sid. 


85% Cc 


thich -.4286 .10882 .801 -.8E 
khong thich lam .4286 .10882 IIẾ 
khong thich lam .BB57 .10882 .42 


Means for groups in hamaogeneous subse†s are 


displayed. 


Based an o0bser/sdl maans. 


Tha ¬rr¬r ‡†¬arexa in hÃ san Yzioinar^ ffFFrrar\A = 4^14 


Giá trị Sig. cho thấy các sinh viên có mức độ yêu thích ngành học nhiều hoặc rất nhiều thì 
không có khác biệt nhau về kết quả học tập vì giá trị Sig. cho chênh lệch giữa hai nhóm 2 


và nhóm 3 lớn hơn mức ý nghĩa 0.05. 
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Chương 4 
ỨNG DỤNG MÔ HÌNH HỎI QUY TUYẾN TÍNH 


4.1. Phân tích hồi quy 
Phân tích hồi quy là một trong những công cụ cơ bản của kinh tế lượng. Phân tích 

hồi quy là mô tả mối quan hệ phụ thuộc của một biến (được gọi là biến phụ thuộc hay biến 
được giải thích) vào một hay nhiều biến khác (được gọi là biến độc lập hay biến giải 
thích). Thuật ngữ hồi quy được Francis Galton sử dụng khi ông nghiên cứu các mối quan 
hệ giữa chiều cao của những đứa trẻ và chiều cao của bố mẹ chúng. Ông thấy rằng mặc dù 
bố mẹ cao hay thấp thì cũng có những đứa trẻ thấp hay cao, nhưng có một xu thế là chiều 
cao của những đứa trẻ sẽ hội tụ về một chiều cao trung bình nào đó phụ thuộc một phần 
vào chiều cao của bố mẹ. Khi số biến độc lập bằng I thì ta gọi là hồi quy đơn. Chăng hạn 
mô hình hồi quy đơn với một biến phụ thuộc Y và một biến độc lập X trong đó Y là mức 
chỉ tiêu và X là thu nhập. Khi số biến độc lập lớn hơn 1 thì ta gọi là hồi quy bội. Chẳng 
hạn mô hình hồi quy bội với một biến phụ thuộc Y và hai biến độc lập X: và Xa trong đó Y 
là doanh thu của công ty, X: là chỉ phí cho quảng cáo và Xa là lương trả cho nhân viên tiếp 
thị. 
Phân tích hồi quy giải quyết những vấn đề sau đây: 

e_ Ước lượng giá trị trung bình của biến phụ thuộc với giá trị đã cho của biến độc lập. 

e Dự báo giá trị của Y khi biết được giá trị của biến giải thích X. 

se Kiểm định giả thuyết về bản chất của sự phụ thuộc và xác định hiệu quả tác động 

của biến độc lập lên biến phụ thuộc. 

Đề hiểu điều này được thực hiện như thế nào, hãy xem xét ví dụ sau: 
Ví dụ 1. Giả thiết có một khu phố gồm 50 hộ gia đình. Để nghiên cứu mối quan hệ giữa 
chỉ tiêu tiêu dùng hàng tháng của hộ gia đình, ký hiệu là Y (đơn vị: triệu đồng) và thu nhập 
khả dụng hàng tháng của hộ gia đình hay thu nhập sau khi đã đóng thuế, ký hiệu là X (đơn 
vị: triệu đồng), chúng ta chia 50 hộ gia đình thành 10 nhóm có thu nhập tương đối như 
nhau và xem xét chi tiêu tiêu dùng của các hộ gia đình trong từng nhóm thu nhập này. 


Bảng 4.1: Thu nhập X và chi tiêu tiêu dùng Y hàng tháng của các hộ gia đình 


X 20 25 30 35 40 45 50 5 60 65 
10 13 12 15 19 20 23 Đặc 30 Đàn) 
12 15 13 lý) 22 22 Bà) 28 3l 34 

Y 15 19 20 20 24 ĐÁ 28 30 35 Sĩ 
16 21 BÁC, 9) ĐẠI 30 30 2) - 40 
20 S2 25 28 28 33 32 2 - - 
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| | 23 : 27 | 30 : - - : : 
| Tổng cộng | % | 90 | 120 | 132 | 120 | 130 | 140 | 150 | 9% | 136 


Bảng 4.1 được giải thích như sau: Mỗi cột dọc của Bảng 4.1 cho thấy sự phân phối của chỉ 
tiêu tiêu dùng Y ứng với một mức thu nhập X có định. Chắng hạn như tương ứng với thu 
nhập hàng tháng là 20 triệu đồng, có sáu hộ gia đình có mức chỉ tiêu tiêu dùng hàng tháng 
trong khoảng 10 đến 23 triệu đồng. Lưu ý rằng các đữ liệu trong Bảng 4.1 tiêu biểu cho 
tổng thể, do đó chúng ta có thể tính các xác suất có điều kiện của Y theo X, kí hiệu là 
p(Y|X). Điều này có nghĩa là chúng ta thấy được phân phối có điều kiện của Y phụ thuộc 
vào các giá trị nhất định của X. Xác suất có điều kiện của các đữ liệu trong Bảng 4.1 được 
trình bày trong bảng sau: 

Bảng 4.2: Xác suất có điều kiện p(Y|X) của đữ liệu trong Bảng 4. 


X 20 25 30 35 40 45 50 55 60 65 
1/6 1/5 1/6 1/6 1/5 1/5 1/5 1/5 1/3 1⁄4 
1/6 1/5 1/6 1/6 1/5 1/5 1/5 1/5 1/3 1⁄4 
1/6 1/5 1/6 1/6 1/5 1/5 1/5 1/5 1/3 1⁄4 
P(Y|X)L———————| ————————————————————_———— 
1/6 1/5 1/6 1/6 1/5 1/5 1/5 1/5 1⁄4 
1/6 1/5 1/6 1/6 1/5 1/5 1/5 1⁄5 
1/6 1/6 1/6 
Trung 
bình 
có 
SÄ 16 18 20 22 24 26 28 30 32 34 
điều 
kiện 
của Y 


Ở bảng trên, đối với mỗi phân phối xác suất có điều kiện của Y chúng ta có thể tính được 
giá trị trung bình của nó, được gọi là ng bình có điểu kiện hay kỳ vọng có điêu kiện, 
được thê hiện bằng E(Y |X = Xi) và được diễn giải là "giá trị kỳ vọng của Y khi X nhận 
một giá trị cụ thể X¡", để đơn giản hóa về mặt ký hiệu chúng ta viết lại thành E(Y ÏXi). 
Chẳng hạn như E(Y [X = 20) = 10 (1/6) + 12(1/6) + 15(1⁄6) + 16(1/6) + 20(1/6) + 23(1/6) 
= 15.8. Các trung bình có điều kiện khác được tính tương tự và các kết quả này được đặt ở 
hàng cuối cùng của Bảng 4.2 

Nhận xét rằng mặc dù có sự biến đổi trong chỉ tiêu tiêu dùng của từng hộ gia đình, 
nhưng chỉ tiêu tiêu dùng về mặt trung bình sẽ tăng khi thu nhập tăng. Về mặt hình học, đồ 
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thị phân tán cũng cho chúng ta thấy được điều này. Đồ thị phân tán cho thấy rằng các trung 
bình có điều kiện này nằm trên một đường thắng. Đường thắng này được gọi là đường hồi 
quy tổng thể. 

4.2. Hàm hồi quy tổng thể 

Vì E(Y|X) là một hàm của biến giải thích X nên ta viết E(Y|X) = f (X). Phương 
trình này được gọi là hàm hôi quy tông thê (PRF: Population Regression Function) hay hồi 
quy tông thể (PR: Population Regression). Hàm f (X) có dạng như thế nào? Trên thực tế, 
chúng ta không thể có toàn bộ đữ liệu của tổng thể, do đó, dạng hàm của PRF là một vẫn 
đề thực nghiệm. Giả sử rằng chỉ tiêu tiêu dùng là có quan hệ tuyến tính với thu nhập. Khi 
đó, E(Y|X) là một hàm tuyến tính của X và được viết như sau: 

E(Y |X)=B,+B;X (4.1) 
trong đó J,,B„ là các tham số không biết nhưng không thê thay đổi được và được gọi là 
các hệ số hồi quy: B, còn được gọi là hệ số tung độ gốc hay hệ số chặn và B; còn được 
gọi là hệ số độ dốc hay hệ số góc, Y là biến phụ thuộc hay biến được giải thích (explained 
variable), X là biến độc lập hay biến giải thích (explanatory variable). 

Phương trình (2.1) được gọi là hàm hồi quy tổng thể tuyến tính hay mô hình hồi 
quy tổng thể tuyến tính hay phương trình hồi quy tổng thê tuyến tính. Trong các phần 
tiếp theo, các thuật ngữ hàm hồi quy, phương trình hồi quy, và mô hình hồi quy sẽ được 
dùng với nghĩa như nhau. Thuật ngữ “tuyến tính” ở đây được hiểu như sau: E(Y | X,) là 
một hàm tuyến tính theo các tham số P,: nó có thể tuyến tính hoặc có thê không tuyến tính 
theo biến X. Theo cách giải thích này, E(Y |X)=B,+B„X là một mô hình tuyến tính 
nhưng E(Y |X)=¡+ \B,X thì không phải vì tham số B; có lũy thừa bằng 1/2. Trong 
phần này, chúng ta sẽ không bàn tới những mô hình hồi quy không tuyến tính theo các 
tham số. 

Từ Bảng 4.2, nhận thấy rằng khi thu nhập hàng tháng của các hộ gia đình tăng, chỉ 
tiêu tiêu dùng của các hộ gia đình về mặt trung bình cũng tăng theo. Tuy nhiên, chỉ tiêu 
tiêu dùng của từng hộ gia đình không nhất thiết phải tăng khi mức thu nhập tăng. Ví dụ, 
trong Bảng 4.1 chúng ta quan sát thấy tương ứng với mức thu nhập 55 triệu đồng một 
tháng có một gia đình với mức chỉ tiêu tiêu dùng là 28 triệu đồng, thấp hơn mức chỉ tiêu 
tiêu dùng của hai hộ gia đình mà mức thu nhập hàng tháng của họ là 50 triệu đồng. Nhưng 
lưu ý rằng mức chỉ tiêu tiêu dùng trung bình của các hộ gia đình với thu nhập hàng tháng 
là 55 triệu đồng là lớn hơn mức chỉ tiêu tiêu dùng trung bình của những hộ gia đình có 
mức thu nhập hàng tháng là 50 triệu đồng (28 triệu đồng so với 30 triệu đồng). Như vậy, 
chúng ta có thể nói gì về mối tương quan giữa mức chỉ tiêu tiêu dùng của từng hộ gia đình 
và một mức thu nhập nhất định. Chúng ta thấy rằng với mức thu nhập là X¡, mức chỉ tiêu 


tiêu dùng của từng hộ gia đình xoay xung quanh chỉ tiêu trung bình của tất cả các hộ gia 
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đình ở tại Xi, có nghĩa là xung quanh kỳ vọng có điều kiện của nó. Do đó, chúng ta có thể 
diễn đạt độ lệch của một giá trị Y¡ xung quanh giá trị kỳ vọng của nó như sau: 
u,=Y,-E(Y |X,) 

hay 

Y,=E(Y |X,)+u, (4.2) 
trong đó độ lệch u¡ là một biến số ngẫu nhiên không thể quan sát và nhận giá trị âm hoặc 
dương. Đại lượng u¡ còn được gọi là số hạng nhiễu ngẫu nhiên hay số hạng sai 
số ngẫu nhiên. 

Từ phương trình (4.2), chúng ta có thể nói rằng với một mức thu nhập cụ thể, chi 
tiêu của một hộ gia đình được thê hiện như là tổng của hai thành tố. Thành tố thứ nhất là 
chỉ tiêu tiêu dùng trung bình của tất cả các hộ gia đình có cùng mức thu nhập E(Y | Xj). 
Thành tố này được gọi là thành tổ tất định hay hệ thống. Thành tố thứ hai là thành tố 
ngẫu nhiên hay không hệ thống. Chúng ta có thể giả định rằng thành tố ngẫu nhiên là 
một số hạng thay thế cho tất cả các biến số ta bỏ ra ngoài hay bỏ sót mà có thể ảnh hưởng 
đến Y nhưng không đưa vào trong mô hình hồi quy. Nếu E(Y | X,) được giả định là tuyến 
tính theo Xi thì phương trình (4.2) được biểu diễn như sau: 

Y; = E(CY |X,)+u;¡ =B¡ +B;X, +u, (4.3) 
Phương trình (4.3) giả định rằng chỉ tiêu tiêu dùng của một hộ gia đình có quan hệ tuyến 
tính đối với thu nhập cộng với sỐ hạng nhiễu. Như vậy, chi tiêu tiêu dùng của một hộ gia 
đình, với thu nhập hàng tháng X = 55 triệu đồng, có thể được biêu diễn như sau: 
Y,.=25=P,+B;x55+u; 
Y,=28=P,+B,x55+u; 
Y, =30=ÿ,+„x5Š5+u, 
Y,=32=;+B;*55+ú 
Y, =35=ÿ,+„x55+u, 
Lấy kỳ vọng hai về của phương trình (4.2), ta được 
E(Y,|X,)= B[E(Y | X,)|J+ E(@, |X;,) 
© E(Y,|X,)= E(Y |X,)+E(u,|X,) (4.4) 
E(u, |X,)=0. 


Vì E(Y,|X,)= E(Y |X,) nên Như vậy, giả định cho rằng đường hồi 
quy đi ngang qua các giá trị trung bình có điều kiện của Y có nghĩa là các giá trị trung bình 
có điều kiện của ư¡ (phụ thuộc vào các giá trị của X) là bằng 0. 


4.3. Hàm hồi quy mẫu 
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Giả sử rằng chúng ta chưa biết được thông tin của tổng thể được cho ở Bảng 4.1 và 
chúng ta chỉ có thông tin của hai mẫu ngẫu nhiên như ở Bảng 4.3 và Bảng 4.4. Trong Bảng 
4.3 hay Bảng 4.4, ứng với mỗi giá trị của X, chỉ có một giá trị duy nhất Y. 

Bảng 4.3: Mẫu ngẫu nhiên thứ nhất từ tông thê 
Thu nhập X 20 25 30 35 40 45 50 "Bị 60 65 
Chỉ tiêu Y 12 19 20 28 30 SÁ, 68; cm 3] 3 


Bảng 4.4: Mẫu ngẫu nhiên thứ hai từ tổng thể 
Thu nhập X 20 SẠI 30 35 40 45 50 55 60 6S 
Chỉ tiêu Y l 15 25 20 ĐÀ) 30 28 Bì 30 40 


Dữ liệu ở Bảng 4.3 và Bảng 4.4 được thể hiện ở hình sau: 


40 45 


35 
30 


30 
> 25 


20 


15 


Hình 4.2: Dữ liệu từ Bảng 4.3 Hình 4.3: Dữ liệu từ Bảng 4.4 


Ứng với mỗi mẫu, sẽ có một đường hồi quy tương ứng. Đường hồi quy này được 
gọi là đường hồi quy mẫu. Nhận xét rằng với bao nhiêu mẫu ngẫu nhiên thì sẽ có bấy 
nhiêu đường hồi quy mẫu. Những đường hồi quy mẫu này nói chung không giống nhau và 
phản ánh được tính chất của đường hồi quy tổng thể. Tương ứng với đường hồi quy mẫu, 
chúng ta thiết lập một hàm số, được gọi là hàm hồi quy mẫu (Sample Regression Function- 
SRF). Hàm hồi quy mẫu ứng với hàm hồi quy tông thê 

ECY | X,) = Bị + B:X;, 


có dạng như sau: 
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Ÿi = ñ, mn bu: 43) 


E(Y|Xj) B. và 


trong đó, Y¡ là hàm ước lượng của P› được gọi là các hệ sô hôi quy 


mẫu và lần lượt là các ước lượng của các hệ số hồi quy tông thể P. và B; tương ứng. 
Hàm hồi quy mẫu cũng có thể được biểu diễn dưới dạng ngẫu nhiên cho từng quan 
sát: 
Y,= ñ, + B,X, kinh 4.6) 
hay một cách tổng quát: 

Y=8,+B,X+u 47) 
trong đó U¡ là số hạng phần dư mẫu và U¡ có thể được xem là một ước lượng của u¡. Việc 
đưa thành phần U¡ vào trong hàm hồi quy mẫu và việc đưa thành phần u¡ vào trong hàm 
hồi quy tổng thê là có cùng lý đo. 

Câu hỏi đặt ra là làm thế nào để ước lượng chính xác tối đa hàm hồi quy tổng thể 
(PRF) trên cơ sở hàm hồi quy mẫu (SRF). Để thực hiện điều này, phương pháp bình 
phương tối thiểu thông thường (OLS) là một trong những phương pháp được sử dụng 
phô biến nhất. 
4.4. Phương pháp bình phương tối thiểu thông thường (Ordinary Least Squared- 
OLS) 
4.4.1. Nội dung phương pháp OLS 

Xét hàm hồi quy tổng thể dưới dạng tuyến tính: 

Y=B,+B,X+ÙU 


Ta cần ước lượng các hệ số /Ø,, Ø,. Giả sử có mẫu ngẫu nhiên kích thước n là {(Xi, Y;), ¡ = 
1, ..., n} được rút ra từ tổng thể. Từ mẫu nảy, ước lượng các giá trị của 8, ổ,. ta được hàm 
hồi quy mẫu sau: 

Y=B,+D,X 
hay có thể viết cho từng quan sát 

Y, =B¡+B;X; 
Các dạng trên là dạng xác định của hàm hồi quy mẫu, ta có thể viết hàm hồi quy mẫu dưới 


dạng ngẫu nhiên như sau: 


hay có thể viết cho từng quan sát 
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TH ô, +B,X, +Ùi 
Đặt Liyế Y,-— N. và đại lượng này được gọi là phần dư (Residuals). Hàm hồi quy mẫu và 
phần dư có thê được minh họa như hình dưới đây: 


Ã 


Hàm H 


Hình 4.4: Hàm hồi quy mẫu và phần dư 
Ta muốn xác định các giá trị ñ, Ô, sao cho tổng bình phương các sai lệch giữa các giá trị 
thực tế Y¡ và giá trị ước lượng tương ứng từ hàm hồi quy mẫu là nhỏ nhất, tức là tìm các 
giá 


trị Ô,,Ô, sao cho `(Y, — Ý,ÿ = Ÿ`(Y,— ð,— Ö„X,} = /(Ô,,Ö,) ¬ min 


;=l ¡=l 


TT —. 
Đây là bài toán cực trị hai biên không có điều kiện ràng buộc, do đó /,, /; sẽ là nghiệm 


của hệ phương trình sau: 


ØƑ _ — “ z l : 
ĐÀ T2 MT —ÁX)=Đ_ [âm+Â»x,= 5y 


— h 
——=-2}_*x.ữŒ, - Â - Ê,X,) =0 8Ð X.+8,À,X: =2„X 
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Ta gọi ñ,, Ô, là các ước lượng bình phương nhỏ nhất (OLS) của 8:8, 

Ví dụ 2. Bảng sau đây cho số liệu về mức chỉ tiêu tiêu dùng hàng tháng của hộ gia đình, ký 
hiệu là Y (đơn vị: triệu đồng) và thu nhập khả dụng hàng tháng của hộ gia đình hay thu 
nhập sau khi đã đóng thuế, ký hiệu là X (đơn vị: triệu đồng) của một mẫu gồm 10 hộ gia 
đình. Giả sử Y và X có mối quan hệ tuyến tính. Hãy ước lượng hàm hồi quy của Y theo X. 
Bảng 4.5: Mẫu ngẫu nhiên từ tông thể 

Thu nhập X 20 25 30 35 40 45 50 55 60 65 
Chỉ tiêu Y 12 19 20 28 30 ĐI k9 35 31 Sự 


Từ các số liệu quan sát của X và Y ở Bảng 2.5, ta tính được 
3 V470, 3 1200 ) 4. = 201203 A1. .<122590 1 S420; r20ð 


Do đó, 


1 S`XY-nXY 
2 „10 C5!” 12280—10x42.5x26.5 - 1017.5 


=L =E,— mm — T7. ca.“ .=0493 
“ . 5 Xj-n(X} 20125 - 10 x (42.5) 2062.5 


B =Y -ñ,X = 26.5 — 0.493 x 42.5 = 5.5475 
Vậy hàm hồi quy mẫu của chỉ tiêu tiêu đùng theo mức thu nhập là: 
Ÿ,=B,+,X, = 5.5475 + 0.493X, 
Ý nghĩa các hệ số ước lượng: 

° 3, = 5.5475: Chi tiêu tiêu dùng trung bình hàng tháng của một hộ gia đình khi thu 
nhập hàng tháng bằng 0. 

° JỆ) = 0.493: Xét mức thu nhập nằm trong khoảng (20, 65) triệu đồng một tháng, 
nếu khi thu nhập tăng thêm I triệu đồng/tháng thì chỉ tiêu tiêu dùng trung bình tăng 
thêm khoảng 0.493 triệu đông/tháng. 

Thực hiện trên Eviews ta được kêt quả sau: 
Dependent Variable: Y 
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Method: Least Squares 
Sample: 1 10 
Included observations: 10 


Variable Coefficent  Std. Error t-Statistic Prob. 

X 0.493333 0.073251 6.734867 0.0001 

C 5.99333) 3.286089 1.683866 0.1307 
R-squared 0.850071 Mean dependent var 26.50000 
Adjusted R-squared 0.831329_ S.D. dependent var 8.100069 
S.E. of regression 3.326660_ Akaike info criterion 5.418671 
Sum squared resid 88.53333 Schwarz criterion 5.479188 
Log likelihood -25.09336_ Hannan-Quimn criter. 5.352284 
F-statistic 45.35843_ Durbin-Watson stat 3.303012 
Prob(F-statistic) 0.000147 


Chú thích cho bảng kết quả như sau: 


Dependenmt Variable: Biến phụ thuộc Y. 


Method: Least Sạuares: Sử dụng phương pháp bình phương tối thiểu OLS. 


Da, Time: Ngày, giờ thực hiện. 
Sample: Phạm vi của mẫu quan sát. 


Tncluded observarions: Tông sô quan sát (cỡ mẫu). 


Variable: Danh sách các biễn độc lập trong mô hình hồi quy, trong đó C là hệ số 


8. 

Coefficieni: Các ước lượng hệ số của mô hình. 

S4. Error: Sai sô chuân của F và 8. 

†-Statistic: Giá trị (quan sát) của thông kê T. 

Prob.: Giá trị p-value của thông kê T. 

R-sauared: Hệ số xác định (hệ số tương quan toàn phần) #?. 
Adjusted R-sạuared: Hệ số xác định đã được hiệu chỉnh F5 
Š.E. oƒregression: Sai số tiêu chuẩn của hàm hồi quy. 

Sưm sqạuared resid: Tông bình phương sai số RSS. 

Log likelihood: Logarit cơ sô e của hàm hợp lý. 

EFstatistic: Giá trị thông kê của thông kê E. 
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®_ Prob(E-statistic): P(F > F`- statistic). 
e Mcan dependen var: Trung bình của biến phụ thuộc. 
e  Š.D. dependerní var: Độ lệch chuẩn của biến phụ thuộc. 
e Akaike inƒo criterion: Tiêu chuẩn Akaike. 
e_ Schwarz criferion: Tiêu chuân Schwarz. 
e Hannan-Quinn criter.: Tiêu chuân Hannan-Quinn. 
e Durbin-Waison sat: Thông kê Durbin-Watson. 
4.4.2. Mô hình hồi quy tuyến tính cỗ điển: Các giả thiết cơ bản của phương pháp OLS 
Mô hình hồi quy tuyến tính cô điển hay mô hình chuẩn, mô hình Gauss (CLRM) 
được coi là nền tảng của hầu hết lý thuyết kinh tế lượng, gồm 10 giả thiết sau: 
Giả thiết I1: Mô hình hồi quy là tuyến tính theo các tham só, tức là 
Y¡ =B,+B;,X, +U, 48) 
Giả thiết 2: Các giá trị X được cô định trong việc lấy mẫu lập lại. Điều này có nghĩa là X 
được giả thiết là không ngẫu nhiên. 
Chăng hạn như với dữ liệu ở Bảng 2.1, để có các mẫu ngẫu nhiên, ta giữ giá trị thu nhập X 
cô định và giả sử bằng 55 triệu đồng, ta rút ra một cách ngẫu nhiên một hộ gia đình nào đó 
và có được thông tin về chỉ tiêu hàng tháng Y của hộ gia đình đó, giả sử là 2§ triệu đồng. 
Vẫn giữ X ở mức 5Š triệu đồng, ta lại rút một cách ngẫu nhiên một hộ gia đình khác vả 
thấy giá trị quan sát Y của nó là 32 triệu đồng. Trong mỗi lần rút ra một hộ gia đình đề 
xem xét, giá trị X được cô định ở mức 55 triệu đồng. Ta có thê lặp lại quá trình này cho tất 
cả các giá trị X đã ghi trong Bảng 2.1. Tắt cả những điều này có nghĩa là sự phân tích hồi 
quy được trình bày là phân tích hôi quy có điều kiện, nghĩa là các giá trị của (các) biến hồi 
quy độc lập X được cho trước. 
Giả thiết 3: Cho trước giá trị của X, giá trị trung bình hay kỳ vọng của các số hạng nhiễu 
U¡ bằng 0, tức là 
E(U,|X.)=0. 
Nhận xét rằng giả thiết này ngụ ý rằng E(Y |X,)=B,+B„X,. Do đó, hai giả thiết này là 
tương đương với nhau. 
Giá thiết 4: Cho các giá trị của X, phương sai của U¡ sẽ như nhau đối với tất cả mọi quan 
sát, tức là: 


var(U, |X,) = E[_U, - E(U,)|X, | = E(U?|X,)}=ø?,Vi=1,n 


trong đó var là ký hiệu của phương saI. 
Về mặt đồ thị, giả thiết này được mô tả như hình dưới đây: 
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f(u) 


lê) 


*v 


Hình 4.5: Phương sai có điều kiện không đôi 


Giả thiết 5: Cho trước hai giá trị bất kỳ X¡ và Xị với ¡ # j, tương quan giữa U¡ và U; bất kỳ 
với ¡z j bằng 0, tức là 
cov(U,,U, |X,„X,)= E|(U, —E(U,)|X,)(U,—E(UIX;) |= E|(U,IX,)(U,IX;)|=0 


trong đó ¡ và j là hai quan sát khác nhau và cov là ký hiệu của đồng phương sai. 
Giá thiết 6: Đồng phương sai giữa U¡ và X¡ bằng 0. Ký hiệu là cov (U¡, X;) = 0. 
Giá thiết 7: Số lượng các quan sát n phải lớn hơn số lượng các biến giải thích. 
Giả thiết 8: Các giá trị X trong một mẫu cho trước không thể tất cả đều bằng nhau. 
Giả thiết 9: Mô hình hồi quy được xác định một cách đúng đắn. Điều này có nghĩa là phải 
xác định đúng các biến xuất hiện trong mô hình, dạng hàm hồi quy, quy luật phân phối xác 
suất của các biến ngẫu nhiên. 
Giá thiết 10: Không có các mối tương quan tuyến tính hoàn hảo trong các biến giải thích. 
4.4.3. Các tính chất của hàm ước lượng OLS 

Các tính chất của hàm ước lượng OLS được thể hiện ở Định lý Gaus-Markov, cụ 
thể như sau: 
Định lý Gauss-Markov: Cho trước các giả thiết của mô hình hồi quy tuyến tính cổ điển, 
các 
hàm ước lượng bình phương tối thiểu, trong nhóm các hàm ước lượng tuyến tính không 
chệch, có phương sai nhỏ nhất, nghĩa là chúng là các hàm ước lượng không chệch tuyến 
tính 
tốt nhất (BLUE: Best Linear Unbiased Estimation). 


Tính tuyến tính của các hàm ước lượng B::P; được hiểu là B.›P2 là các hàm tuyến tính 


theo các biên ngâu nhiên Y1, Y:,.... 


Các hàm ước lượng B.:B› không chệch, có nghĩa là FÍẾ.) = B,.E(B.) =B;. 


S2 


Các hàm ước lượng B.›P› có phương sai nhỏ nhất trong nhóm tất cả các hàm ước lượng 
không chệch tuyến tính; hàm ước lượng không chệch với phương sai tối thiêu được gọi là 
hàm ước lượng hiệu quả. 

4.4.4. Độ chính xác của các ước lượng OLS 


Tính không chệch của ước lượng cho biết trung bình của sai lệch của các giá trị Ỗi 


P 


có thể lớn thế nào. Nếu các sai lệnh này là nhỏ thì khi lấy một mẫu bắt kỳ, ta có thê hy 


thu được từ các mẫu khác nhau so với "7 bằng 0. Tuy nhiên, ta lại không biết sai lệch này 


^ 


B 


vọng rằng giá trị "? thu được là không quá khác biệt so với giá trị Ũ, chưa biết. Khi đó, ta 


^ 


B 


nói độ chính xác của * là cao. Như vậy, độ chính xác của các ước lượng được đo bởi độ 


n ¬ : Ä 
phân tán của Ũ, xung quanh Ũ, tương ứng, nghĩa là F||6 B,] | Khi Ũ, là ước lượng 
không chệch của Ũ, , nghĩa là F|6.) =B,, thì độ chính xác này chính là phương sai của 


các ước lượng. Cụ thê như sau: 


rlÍô-8} ]-e[8 -ris)Ï]=s) 


Khi phương sai càng bé thì độ chính xác của ước lượng cảng cao. Phương sai của các ước 
lượng được thê hiện qua định lý dưới đây. 
Định lý: Khi các giả thiết 1, giả thiết 2, giả thiết 3 và giả thiết 4 được thỏa mãn thì phương 


sai của các hệ sô ước lượng được xác định bởi 


2 
MB Ø 
var| 8) =x 
Š|x.-x) 
/=l 
Trong thực tế ta thường không biết øˆ, do đó trong các công thức trên, ta thay ø” bởi ước 


*“Ä ^ ^ L$ LÃ 3 z 7 1*A 2. 2 ` z . 
lượng điêm không chệch, tôt nhât của nó, kí hiệu bởi Ø“ và được xác định như sau: 
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Đại lượng Ø còn được gọi là sai sô chuân của hảm hôi quy (Standard Error of 
Regression). 

z 2 ? ^^ ^^ 
Như vậy, các sai sô chuân (Standard error) của các hệ sô ước lượng /,, /Ø; được xác định 


bởi các công thức sau: 


4.5. Độ phù hợp của hàm hồi quy mẫu. Hệ số xác định R? 

Để xác định sự thay đổi của biến độc lập giải thích được bao nhiêu phần trăm sự 
thay đôi của biễn phụ thuộc, chúng ta sử dụng một đại lượng được gọi là hệ sỐ xác định 
(Coefficient of Determination), ký hiệu là r? trong trường hợp hồi quy hai biến và ký hiệu 
là R? trong trường hợp hồi quy đa biến. Phương pháp tính r? sẽ được trình bày ở phần dưới 
đây. 

Ta có Y,= Ÿ¡+Ùi hay y,= Ÿ, +u¡. Bình phương hai về của phương trình này, lấy tổng 
đối với mẫu và sử dụng các kết quả , Ÿ, u¡ =Ũ Và ÿ, = B„x,. ta được: 
^2 ^2 ^^ ^2 ^2 ^2 ^2 
»y, =jY + uị +23 y, ui => Vy, +ui =b 3x +ui 
Ẫ 2 =a\2 4 . . » . 
Trong đó, tông bài => lY — X] là độ lệch tông cộng các giá trị thực của Y so với trung 
bình mẫu của chúng và được gọi là tổng bình phương toàn phần (TSS: Total Sum of 
h ^2 ^  ^\? ¬-ˆ 
Squares); tổng Ð_y, ĐÀN: -Ÿ] = xi -Y) =B,> x7 là chênh lệch của giá trị ước 
lượng của Y với trung bình của chúng và được gọi là tổng bình phương hồi quy (ESS: 


\ ^ — h ^2 h 
Explained Sum of Squares). Lưu ý răng Y =Y.. Tông » được gọi là tông bình phương 


phần dư hay tổng bình phương sai số (RSS: Residual Sum of Squares). Do đó, ta có: 
TSS =ESS + RSS 


Chia hai về của phương trình trên ta được 
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,_PSS, Rss 2 [Si-Y) - Sài 
TSS TSS >ấY-Y) »(y.-Y} 


H Ẵ °. Ấ E Phềi : X 2 
Đại lượng rˆ được xác định bởi tỷ số n biêu thị phân trăm của độ lệch tông cộng trong 
Y được giải thích bởi mô hình hồi quy. Ta viết 
2_Es§_ >|Y —Y) —'—~..... 
= = —>= —;= 
TSS >(Y.-Y) vi ý _Y) TSS 


Y,—Y = tổng cộng 


Hình 4.6: Minh họa tổng bình phương phần dư 
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Chương Š 
MÔ HÌNH HỎI QUY BỘI 


Trong thực tế, các mối quan hệ kinh tế thường phức tạp, một biến số kinh tế có thể 
chịu sự tác động của nhiều biến số kinh tế khác nhau. Chắng hạn, khi nghiên cứu nhu cầu 
về một loại hàng hóa nào đó thì nhu cầu này phụ thuộc đồng thời vào nhiều yếu tố như thu 
nhập của người tiêu dùng, giá bán của hàng hóa đó, thị hiếu người tiêu dùng... Do đó, cần 
thiết phải nghiên cứu mô hình hồi quy nhiều hơn hai biến, còn gọi là mô hình hồi quy bội 
(Multiple regression). 

5.1. Mô hình hồi quy bội tuyến tính 
Mô hình hồi quy tuyến tính k biến có thê viết đưới dạng sau: 

Y=P,+;X;+---+P,X,+U n1) 
trong đó Y là biến phụ thuộc, X,J= 2,k là các biến độc lập, P,,J= l,k được gọi là các 
hệ số hồi quy bội, U là sai số ngẫu nhiên, đại diện cho các yếu tố khác ngoài X¡ có tác động 
đến Y nhưng không được đưa vào mô hình với lý do chúng ta không có quan sát về nó, 
hoặc không muốn đưa nó vào mô hình, hoặc không thể đưa nó vào mô hình. 
Các giả thiết cho mô hình (5. 1): 
Giả thiết I: Mô hình được ước lượng dựa trên mẫu ngắu nhiên 

((X„.Y,):¡ =l,n,j =2,k) 
Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên tại mỗi giá trị (Xai, Xi, ..., X4j) bằng 0 
E(U|Xz,2„Xu.)=0:W1=Lta 

Giả thiết 3: Phương sai của sai số ngẫu nhiên tại các giá trị (Xai, Xi, ..., Xu) là hằng số 


Var(U |X¿„,..., Xu) = ø?,Vi =l,n 


Giả thiết 4: Giữa các biến độc lập ÄX j J=2,k không có mối quan hệ đa cộng tuyển hoàn 
hảo, có nghĩa là không tôn tại các hằng số 1Ñ 2K không đồng thời bằng 0 sao 
k 
ĐÁ Di BÀI 0. 
Ví dụ 1. Để xem tác động của các hình thức đầu tư lên GDP, người ta sử dụng hàm hồi 
quy bội tuyến tính 
GDP=8.+Ø,GI+ Ø,PI+ 6,FDI + 6 I+U 
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với GI, DI, FDI, I lần lượt là đầu tư của khu vực nhà nước, đầu tư từ khu vực tư nhân, đầu 
tư trực tiếp từ nước ngoài và tổng đầu tư. 
Vì I=GI+ PI+ FDI © GI + PI + FDI - Ï = 0nên mô hình này vi phạm Giả fhiết 4 
do giữa các biến độc lập GI, DI, FDI, I có quan hệ đa cộng tuyến hoàn hảo. 
Với Giả thiết 2 được thỏa mãn thì từ mô hình (3.1) ta được 

E(Y |X;.....X,)=B,+B;X;+---'+B,Xy 
Khi đó, J¡ còn được gọi là hệ số chặn và ƒ, chính là giá trị trung bình của biến phụ thuộc 
Y khi các biến độc lập trong mô hình nhận giá trị bằng 0. 
Các hệ số góc 
9.010 4IP247 7.8) 


„j=2,k 
ôX, : 


8,= 


được gọi là các hệ số hồi quy riêng (partial coefficient), cho biết khi một biến X., j = 5+ 
thay đổi một đơn vị, các biến khác cô định thì trung bình của Y thay đổi ,, j= 2,k đơn 
vị. Nếu có B, nào đó bằng 0, ta nói biến Y không phụ thuộc vào biến độc lập X¡, có nghĩa 
là biến X; không giải thích cho Y. Nếu tất cả B, đều bằng 0, ta nói các biến độc lập đều 
không giải thích cho biến phụ thuộc Y, và hàm hồi quy trong trường hợp này được gọi là 
không phù hợp. Ngược lại, chỉ cần có ít nhất một biến độc lập giải thích cho biến phụ 
thuộc Y thì hàm hồi quy được gọi là phù hợp. 
Ví dụ 2. Giả sử ta có mô hình hồi quy bội về lạm phát như sau 
LP =0.01+0.2M —0.15GDP+U 
trong đó LP, M, GDP lần lượt là tỷ lệ lạm phát, mức tăng trưởng cung tiền và mức tăng 
trưởng GDP (đơn vị %). Khi đó, ta có phiên giải từ mô hình trên như sau: 
e - Khi mức tăng trưởng cung tiền và GDP bằng 0 thì mức lạm phát trung bình là 0.01. 
e_ Khi cung tiền tăng (giảm) 1% và mức tăng trưởng GDP không thay đổi thì lạm 
phát trung bình sẽ tăng (giảm) 0.2 đơn vỊ. 
e_ Nếu GDP tăng 1% và cung tiền không thay đổi thì lạm phát trung bình sẽ giảm 
0.15 đơn vị. 
5.2. Phương pháp ước lượng OLS (Ordinary Least Squares) 
Xét mô hình hồi quy tông thể: 
Y=P,.+B;Š;+°-°†+B.Xv.#£U (5.2) 


Để ước lượng các hệ số ÿ,,...,B,„ ta cần rút ra một mẫu ngẫu nhiên kích thước n từ tổng 


thể: (X„;,Y¿,),i =1,n.. Khi đó, ta có 
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Y,=B,+B;X;;+---B,X¿+U; 
Yị= ñ, + B,X., +--:++ ñ.X. 
Ký hiệu phần dư (Residuals): 
Ủi =Y,—Ÿ¡ 
Chúng ta muốn xác định ñ,.....B, sao cho tổng bình phương các phần dư là bé 


nhất, có nghĩa là 


i =>(v.-#:J =3_(Y.-ñi =ỗ„X„ —..—Ê Xu} —> min 


1=l I=l 1=l 


tÍ D0) 


Từ đó ta được 


n 2 n JẤ 2 n 2 


VỚI 
lLX; Xi -— Xã b4 B; 
Xe l X„; Xà; : X\¿ *< Y, B= là 
| Xàn Ẩn : Xu về ñ, 
n 3. Xã 3 3. bã: 
i=l i=l i=l i=l 
êi xí Xung du ý SAU b.ếpp 6 
XTX » 2 » sĩ » Phu) 3 2i“k XTY= » 2 


»›c 3. lAa »c vớ b5 G 2. 
1=l 1=l | Ỉ 


Ví dụ 3. Có số liệu quan sát của 15 cửa hàng khác nhau thuộc cùng một công ty kinh 
doanh cùng loại sản phẩm về lượng hàng bán được Y (tắn“tháng), chỉ phí quảng 
cáo X, (triệu đồng/tháng) và giá bán X ; (ngàn đồng/kg) như sau: 


Y, |14|21 |20 | 18 19 18 |17| 17 | 16 |1 II II NR” 
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Bề G lŠ 999 46.8 
X'Y=|35X, 3X? 3 X,„X,|=|99.9 71323 293.64 
Rb > * 468 293.64 153.52 


46.06 -3.16 -8.01 259.5 19.87 
(x'z) = -316 0⁄22 0.54 |, X7Y=|1801 |==|0.67 
-801 0.54 1.42 780.65 _2.25 


Vậy hàm hồi quy mẫu là 
Ÿ¡ =19.87+0.67X;,—2.25Xy, 
Từ đó có nhận xét về ý nghĩa kinh tế của các tham số hồi quy: 


~^~ 


e  /¡=19.87: Khi doanh nghiệp không quảng cáo và ngay cả khi bán giá cực thấp 
(X, — 0) thì lượng hàng bán được tối thiểu trung bình khoảng 19.87 tắn/tháng. 


«  Ø, =0.67 >0: Nếu giữ nguyên giá bán, khi tăng (giảm) mức quảng cáo một triệu 


đồng/tháng thì sản lượng tiêu thụ trung bình tăng (giảm) khoảng 0.67 tân/tháng. 


e_ /,¿=-2.25<0: Nếu giữ nguyên chi phí quảng cáo, khi tăng (giảm) giá bán một 
ngàn đồng/kg thì sản lượng hàng bán được trung bình giảm (tăng) khoảng 2.25 
tân/tháng. 

Sử dụng phần mềm Eviews, ta có bảng kết quả như sau: 
Dependent Variable: Y 
Method: Least Squares 
Sample: 1 15 
Included observations: 15 


Variable Coefficient Std. Error t†-Statistic Prob. 
C 19.86862 2.694140 7.374756 0.0000 
x2 0.669642 0.187374 3.573835 0.0038 
x3 -2.252705 0473382 -4.758751 0.0005 


R-squared 0.983684_ Mean dependent var 17.30000 
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Adjusted R-squared 0.980965_ S.D. dependent var 2.877251 


S.E. of regression 0.396969 Akaike info criterion 1.166937 
Sum squared resid 1.891008 Schwarz criterion 1.308547 
Log likelihood -5./52028 Hannan-Quimn criter. 1.165429 
F-statistic 361.7403 Durbin-Watson stat 1.755206 
Prob(F-statistic) 0.000000 


Đề đo mức độ dao động và tương quan giữa các hệ SỐ ước lượng được, sử dụng ma trận 
hiệp phương sai của hệ số hồi quy dạng tổng quát: 


var(/2) Cov|8,.8.) _ Cov| 8.8, 


2)= Cov| 8../8,) var| /,) n Cov 8../, 


cov|2 =z?(x'x)' 


Cov| Z../8.) Cov| 8... Sm var| /,) 
Trong thực tế, thường không biết ø”, do đó thay ø” bởi ước lượng điểm không chệch, tốt 


~~ 


LŠ 2 2 z z ^ „2 ^ 
nhât ø“ của nó trong các công thức ở trên: 


~ 
J 


Các sai số chuẩn của 8,.j =lLÈ là Se(/ lỆ var(8,): 
Từ số liệu của Ví dụ 3.3, dễ dàng tính được: 


TSS = Ÿ`Y?—nY” =11.5 
/=l 
^7 đ —2 
ESS= 8 (X'Y)-nY =96 
RSS =1.9 


^2 
Ø = _ =1.9/12=0.16 


m 
Ma trận hiệp phương sai của 8 là: 
727 -0.5_ -l1.26 


Cov|2)= -0.5 0.04 0.08 
-l26 0.08 0.22 
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Cũng có var| /Øj | = 7.27,var| 8, ) = 0.04,var| 2, )= 0.22. 


Sử dụng Eviews, ta được 


C X2 x3 
C 7.25838 | -0.49728 -1.26153 
X2 -0.49728 | 0.03510 0.08444 
X3 -1.26153  0.08444 0.22409 


Định lý Gauss-Markov: K?¡ các giả thiết 1-4 được thỏa mãn thì các ước lượng thu được 
từ phương pháp OLS là các ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất 
trong lóp các ước lượng tuyến tính không chệch (tính chất BLUE-Best Linear Unbiased 
Estimafor). 
5.3. Độ phù hợp của hàm hồi quy mẫu 

Tương tự như hồi quy hai biến, ta có định nghĩa các tổng bình phương độ lệch và 
hệ số xác định như sau: 
Ký hiệu 
TSS=3'(Y,~Y)`=3)Y~nY ` =Y'Y~nY' 

i=l 


1 
I=l 


ESS= S(S, : v} =ô (X'Y)-nY' 
I=l 


RSS= X(y, -#,) =Y'y-Ê (X'y) 
I=l 


Ta có TSS=ESS+RSS 


Hệ số xác định của hàm hồi quy bội cũng được định nghĩa là: 


^AT —2 
g:_ESS _¡_ R§S_ B (XỈY)~nY 
TSS TS v'y_nV 


Khi đó, 0< RŸ <1. Chú ý rằng hệ số xác định trong mô hình hồi quy tuyến tính k 
biến là một hàm tăng theo số biến độc lập. Thật vậy, TSS không phụ thuộc vào số biến độc 
lập trong mô hình với bậc tự do là (n - 1), RSS là hàm giảm theo số biến độc lập trong mô 
hình với bậc tự đo là (n - k), đo đó khi số biến độc lập càng tăng thì hệ số xác định càng 
lớn và mô hình sẽ phức tạp hơn, khó phân tích hơn. Ngoài ra, khi số biến độc lập tăng lên 
sẽ làm tăng mối tương quan giữa các biến độc lập, đồng thời làm giảm bậc tự do của ESS, 
RSS. Do vậy cần cân nhắc cần thận trước khi thêm biến độc lập vào mô hình. 
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Với những chú ý trên, người ta điều chỉnh hệ số xác định bằng cách đưa thêm bậc 


tự do của các tổng bình phương vào công thức để được hệ số xác định hiệu 


chỉnh R (Adjustted R-Squared) sau đây: 


RSS 
= | I—k 
R-I 1. =ĩ=[ISRJ = =R?+(I—R?)— 
n-] 


HA TỶ... .. Ai 
Người ta sử dụng R đê xem xét có nên đưa thêm biên độc lập vào mô hình hay 


không. Việc đưa thêm biến độc lập vào mô hình là cần thiết khi trị số của R trong mô 
hình mới tăng lên, đồng thời hệ số hồi quy của biến độc lập đưa vào khác 0 và có ý nghĩa 
thống kê. Trở lại Ví dụ 3.3, sử dụng phần mềm Eviews để kiểm tra sự thay đổi của hệ SỐ 
xác định trong hai trường hợp: (a) Lượng hàng bán được Y (tắn/tháng) chỉ phụ thuộc vào 
giá bán (ngàn đồng/kg) X ; (triệu đồng/tháng), (b) Lượng hàng bán được Y (tắn/tháng) phụ 
thuộc vào cả chi phí quảng cáo X, (triệu đồng/tháng)và giá bán Y y (ngàn đồng/kg): 

Dependent Variable: Y 

Method: Least Squares 

Sample: 1 15 

Included observations: 15 


Variable Coefficient Std. Error t-Statistic Prob. 


x3 -3.863273 0.200042  -19.31231 0.0000 
C 29.35341 0639968 45.86703 0.0000 
R-squared 0.966318  Mean dependentvar 17.30000 


Adjusted R-squared 0.963727 S.D.dependentvar 2.877251 
S.E.ofregresson 0.547984 Akaike info criteron 1.758423 
Sum squared resd 3.903718  Schwarz criterion 1.852830 
Log Ilikelihood -11.18817  Hannan-Quimn criter. 1.757417 
F-statistic 3729654 Durbin-Watson stat 1.411550 
Prob(F-statistic) 0.000000 


Trường hợp (a) 


Dependent Variable: Y 
Method: Least Squares 
Sample: 1 15 
Included observations: 15 
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Variable Coefficent Std.Error  t-Statstic  Prob. 

C 19.86862 2694140  7.374756 0.0000 

x2 0.669642  0.187374  3.573835 0.0038 

x3 -2.252705 0473382  -4.758751 0.0005 
R-squared 0.983684_ Mean dependent var 17.30000 
Adjusted R-squared 0.980965 S.D. dependent var 2.877251 
S.E. of regression 0.396969 Akaike info criterion 1.166937 
Sum squared resid 1.891008 Schwarz criterion 1.308547 
Log likelihood -5./52028 Hannan-Quimn criter. 1.165429 
F-statistic 361.7403 Durbin-Watson stat 1.755206 
Prob(F-statistic) 0.000000 

Trường hợp (b) 


Ta có TI = 0.963727 “SÁU =0.980965. Do đó, để xem việc đưa thêm biến X2 vào mô 
hình có phù hợp hay không, ta cần kiểm tra liệu có bác bỏ giả thuyết 7#, :/, #0 hay 
không. 
5.4. Một số dạng mô hình hồi quy nhiều biến 
5.4.1. Mô hình logarit kép (Iog-log) 

Xét mô hình hồi quy mũ (cho từng quan sát): 

= Bạ „U 
Y=BX?”e 


Vì mô hình (3.3) không tuyến tính theo cả tham số và biến số nên ta không thê ước lượng 


(5.3) 


nó theo phương pháp OLS. Để ước lượng được các tham số của mô hình này, ta cần 
chuyền về dạng tuyến tính theo tham số như sau: 
Lấy logarit hai về của (3.3), ta được 
InY =InB, +B,lnX+U (5.4) 
Đặt B¡ =InB,, (3.4) trở thành 
In Y, =Bị +B; In X, +U,, 
gọi là mô hình log-log hay logarit kép. Đây là mô hình tuyến tính theo các tham số Bị và 
B„ nên có thê ước lượng chúng bằng phương pháp OLS. 


Nếu đặt Y” =lnY, XỈ =InX thì 
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Y“=Bi+B,X +U 

Đặc điểm: Độ co giãn của Y đối với X được định nghĩa là 
dY/Y _dY X 

€y/x” 
dX/X dX"Y 
Lấy vi phân hai về của (3.4), khi đó 

dY/Y =B,dX/X>£y,y„ =B;. 


Như vậy, ; biểu thị hệ số co giãn của Y đối với X, do đó mô hình logarit kép còn được 
gọi là mô hình hệ số co giãn không đổi. 
Một cách tông quát, mô hình hôi quy dạng logarit kép có dạng như sau: 
InY =P¡ +B; lnX; +---+, InX, +U 
* 


Với mỗi ]= 2,3,...,k, ta có B,= , có nghĩa là nếu X; tăng (giảm) 1% và các 


dX; 
s 


J 

yếu tố khác trong mô hình không đổi thì trung bình Y tăng (giảm) Ð ¡%. và ¡ được gọi là 
hệ số co giãn của Y theo X.. 
Ví dụ 4. Chẳng hạn có hàm cầu về thịt lợn như sau 

InQ =1.5—0.6lnP+U 
Khi đó, hệ số co giãn về nhu cầu thịt lợn theo giá là -0.6, điều này có nghĩa là khi giá thịt 
lợn tăng 1% thì cầu trung bình về thịt lợn giảm 0.6%. 
5.4.2. Mô hình bán logarit 

Trong thực tế, có những trường hợp mô hình logarit kép không còn phù hợp, chăng 
hạn quan hệ giữa tiền lương và số năm kinh nghiệm của người lao động, hoặc tiền lương 
và trình độ học vấn... Khi đó, người ta có thể sử dụng các mô hình bán logarit dưới đây: 
Mô hình log-lin 
Dạng mô hình: 

InY =P,+,X+U (5.5) 
Trong mô hình này, hệ số Ø, được giải thích như sau: Khi X tăng 1 đơn vị thì Y trung 
bình tăng ;„ %. 

Trong nghiên cứu thực nghiệm, mô hình log-lin thích hợp với những tình huống 
như khảo sát tốc độ tăng trưởng hay giảm sút của các biến kinh tế tầm vĩ mô như: Dân số, 
lượng lao động, GDP, GƠNP, lượng cung tiền, năng suất, thâm hụt thương mại,...Chú ý 
thêm rằng mô hình log-lin chỉ thích hợp nếu số liệu chuỗi thời gian có tính chất dừng. 

Ví dụ 5. Giả sử quan hệ giữa thu nhập (TN) và trình độ học vấn (Ed) là 
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InTN =2.5+5.6Ed + U 
Khi đó, ta có thể nói rằng cứ thêm mỗi năm đi học, mức thu nhập trung bình tăng 5.6%. 
Ví dụ 6. Từ công thức tính lãi gộp 

Y.,=Ys(q+r) 

Lấy logarit hai về 

InY, =lnY, +tln(I +r) 
Đặt , =InY,,B„ = In(I+r). Hơn nữa, nếu có thêm yếu tố ngẫu nhiên vảo, ta được mô 
hình log-lin là 

InY, =P,+B,t+U, 


Mô hình lin-log 
Dạng mô hình: 

Y =B,+P,InX+U 53.6) 
Trong mô hình này, hệ số Ø, được giải thích như sau: Khi X tăng 1% thì Y trung bình 
tăng „ đơn vị. 
Trong nghiên cứu thực nghiệm, ta có thể vận dụng mô hình này để khảo sát một số quan 
hệ như: Lượng cung tiền ảnh hưởng tới GDP, diện tích trồng trọt tác động tới sản lượng 
cây trồng, diện tích sử dụng của căn nhà tác động tới giá nhà... 
Ví dụ 7. Có mô hình lin-log về quan hệ giữa số giờ mà người lao động muốn làm (L) và 
mức trả cho một giờ lao động (TL) như sau: 

L=7+0.6lnTL+U 

Kết quả trên cho thấy rằng khi mức trả cho một giờ lao động tăng 1% thì người lao động sẽ 
vui lòng làm thêm 0.6 giờ. 
Nhận xét: 

e_ Dạng hàm logarit thường được lựa chọn khi có gợi ý từ lý thuyết kinh tế về mối 
quan hệ giữa các biến số, chăng hạn như dạng hàm Cobb-Douglas,... 

e© Dạng hàm logarit cũng thường được sử dụng khi các biến số đều nhận giá trị 
dương, hoặc biến số có phân phối đuôi lệch (thu nhập, mức lương, giá cô phiếu....). 
Việc lấy logarit giúp làm cho phân phối của sai số ngẫu nhiên gần với phân phối 
chuẩn, và do đó giúp tăng tính đối xứng của phân phối. 

e_ Việc sử dụng mô hình dạng logarit có ưu thế là kết quả của ước lượng không phụ 
thuộc vào đơn vị đo của các biến số. Tuy nhiên, với những biến số mang cả giá trị 
âm (lợi nhuận công ty, lợi nhuận cô phiếu) thì việc lấy logarit một cách trực tiếp là 
không thực hiện được. 
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5.4.5. Các ví dụ 
Ví dụ 8. Để tìm hiểu giá bán thịt lợn (ngàn đồng) và giá bán thịt gà (ngàn đồng) có ảnh 
hưởng lên mức tiêu thụ thịt lợn hay không (kg/ngày), người ta khảo sát về mức tiêu thụ thịt 
lợn bình quân một ngày tại một siêu thị như sau: 

Giá thị lợn Giá thịt gà Thịt lợn tiêu thụ 


45 S5 1200 
49 S1 1176 
54 76 1152 
58 73 1067 


63 70 1045 


Ước lượng hàm hồi quy dạng: 
+ Tuyến tính: 
Dependent Variable: LUONGLONTIEUTHU 
Method: Least Squares 
Sample: 1 12 
Included observations: 12 


Coefficien 
Variable t{ Std.Error t-Statistic Prob. 


GIATHITLON -5.174643 1.989065 -2.601546 0.0287 
GIATHITGA 6.969852 2.480846 2.809466 0.0204 
C 874.0393 2989491 2923706 0.0169 


Mean  dependent 
R-squared 0.983099var 994.9167 
Adjusted R-squared 0.979344  S.D. dependentvar 145.5125 
S.E.ofregression 20.91355 Akaike info criterion 9.130989 
Sum squared resd 3936.388 Schwarz criterion 9.252216 
Log likelihood -51.78594_ Hannan-Quinn 9.086107 
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F-statistic 


Prob(F-statistic) 


criter. 


261./614  Durbin-Watson stat 0.999101 


0.000000 


+ Mô hình lin-log: 


Dependent Variable: LUONGLONTIEUTHU 


Method: Least Squares 


Sample: 1 12 


Included observations: 12 
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Variable Coefficient Std.Error  t-Statistic Prob. 
LOGX1 -213.3038 89.26039 -2.389680 0.0406 
LOGX2 618.5673 116.0147 5.331799 0.0005 
C -707.8697 8499657 -0.832822 0.4265 
R-squared 0.984665 Mean dependent var 994.9167 
Adjusted R-squared 0.981257 S.D. dependent var 145.5125 
S.E. of regression 19.92154_ Akaike info criterion 9.033798 
Sum squared resid 3571.810 Schwarz criterion 9.155025 
Log likelihood -51.20279__ Hannan-Quimn criter. 8.988916 
F-statistic 288.9389_ Durbin-Watson stat 1.227190 
Prob(F-staftistic) 0.000000 
+ Mô hình log-log: 
Dependent Variable: LOGY 
Method: Least Squares 
Sample: 1 12 
Included observations: 12 
Coefficien 
Variable { Std. Error t-Statistic Prob. 
LOGX1 0.111773 0.118087 -0.946533 0.3686 
LOGX2 0.768074 0.153482_ 5.004325 0.0007 


R-squared 


Adjusted R-squared 
S.E. of regression 
Sum squared resid 
Log likelihood 


F-statistic 


Prob(F-statistic) 


C 


4.136796 


0.974658 
0.969027 
0.026355 
0.006251 
28.33188 
173.0717 
0.000000 


1.124465 3.678903 


Mean dependent var 
S.D. dependent var 
Akaike info criterion 
Schwarz criterion 
Hannan-Quimn criter. 
Durbin-Watson stat 
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0.0051 


6.892549 
0.149752 
-4.221979 
-4.100753 
-4.266862 
1.072395 


Chương 6 
ỨNG DỤNG MÔ HÌNH PHÂN TÍCH NHÂN TÓ KHÁM PHÁ 


6.1. Phân tích mô tả và khám phá 
6.1.1. Thống kê mô tả 

Thống kê mô tả cung cấp các chỉ số cơ bản của biến số với đữ liệu của mẫu 
nghiên cứu. Hầu hết các nghiên cứu định lượng đều cần cung cấp các chỉ số thống kê mô 
tả để giúp người đọc hiểu về dữ liệu sử dụng. Các chỉ số và cách trình bày có thể khác 
nhau với biến định lượng và biến định danh. 

Đối với các biến có giá trị liên tục (biến định lượng). Các nhà nghiên cứu thường 
cung cấp các chỉ số như giá trị trung bình, giá trị lớn nhất, giá trị nhỏ nhất và độ lêch 
chuẩn của biến. Trong một số trường hợp thì cần thêm giá trị trung vị. 

Đối với các biến định danh. Các nhà nghiên cứu thường cung cấp các chỉ số như tần 
suất, tỷ lệ phần trăm trong tổng só, giá trị trung vị, giá trị yếu vị. 

Ví dụ 1. Cho bảng thống kê mô tả của các biến định lượng 


X | X2 | X3 | 
m===== Y x2 x3 ^ 
Mean _j 14143333 20.41867 12.18887 
Median_ |  141.5000 20.50000 12.00000 
Maximum 180.0000 28.00000 17.00000 
Minimum - 102.0000 15.00000 8.000000 
Std. Dev. | 2320789 4.187825 3.352972 
8kewness | -0218444 -0034924  -0.453123 
Kurtosis | 2301580 1.401529 2.378514 
JarqueBera ¡ 0.339345 1.279994 0.803783 
Probability 0.843941 0.527294 0.739428 
Sum | 1898000 245.0000 1486.0000 
SumSq.Dev 5924687 192.9187 123.6887 
Observations _ 12 12 12 v 

« > 


Bảng 6.1. Thống kê mô tả. 


Trong đó 

- Mean: Trung bình của lượng biến. 

- Median: Trung vị của lượng biến. 

- Maximun: Giá trị lớn nhất của lượng biến. 
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- Minimun: Giá trị nhỏ nhất của lượng biến. 
- Std. Dev: Độ lệch chuẩn của lượng biến. 
- Skewness: Hệ số bất đối xứng. 
- Kurtosis: Hệ số nhọn. 
- Jarque — Bera: Giá trị thống kê Jarque — Bera dùng để kiểm định phân phối chuẩn. 
- Probability: Giá trị xác suất của thống kê Jarque — Bera dùng để kiểm định phân phối 
chuẩn. 
- Sum: Tổng các giá trị của lượng biến. 
- Sum Sq. Dev: Độ lệch chuẩn của tổng. 
- Observations: Tổng số quan sát. 
6.1.2. Ma trận hệ số tương quan 
Các biến số có thể có tương quan với nhau, ma trận hệ SỐ tương quan là một công 
cụ ban đầu để giúp các tác giả và người đọc quan sát về mối tương quan của từng cặp 
biến. Công đoạn này cũng giúp các tác giả nhận biết các hiện tượng bất thường hoặc đề 
phòng trường hợp đa cộng tuyến khi các biến độc lập có tương quan lớn. Ví dụ 2. Cho 


ma trận tương quan các biến định lượng như sau: 


Correlation 
Đ? | x2 A_"”"= ma 
].—- Y x2 x3 ^ 
Y ¡_ 1.000000 0.782281 0.804627 
xa | 0.782281 1.000000 0.480173 
X3 | 0904827 0.480173 1.000000 Ũ 
K › 


Bảng 5.2. Ma trận tương quan giữa các biến. 
Ý nghĩa. Ma trận tương quan cho biết mỗi tương quan giữa các biến trong mô hình. Ví 
dụ hệ số tương quan của X¿ và X: là 0,480173; hệ số tương quan của Y và X¿ là 
0,782281; hệ số tương quan của Y và X3 là 0,904627. 
6.1.3. Phân tích nhân tố khám phá 

Phân tích nhân tố khám khá là một phương pháp phân tích thống kê dùng để rút 
gọn một tập gồm nhiều biến quan sát có liên hệ với nhau thành một tập biến (gọi là các 
nhân tổ) ít hơn để chúng có ý nghĩa hơn nhưng vẫn chứa đựng hầu hết nội dung thông tin 
của tập biến ban đầu (Hair và cộng sự, 1998). 

Phân tích nhân tố khám phá thường được sử dụng nhiều nhất trong nghiên cứu 
khảo sát khi mà tác giả phải dùng nhiều câu hỏi để thu thập thông tin một vấn đề trừu 
tượng hơn, đặc biệt là những thông tin về tâm lý, thái độ, thậm chí hành vi. Kế cả khi 
chúng ta sử dụng thước đo đã được các tác giả trước phát triển và kiểm định thì cũng vẫn 


nên thực hiện kỹ thuật này xem liệu các mệnh đề/câu hỏi có “nhóm” đúng theo thước đo 
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ban đầu hay không. Kết quả phân tích nhân tố là cơ sở đề tạo biến số cho các phân tích 
tiếp theo. 
6.1.4. Phân tích độ tin cậy của thước đo 

Phân tích độ tin cậy cho phép chúng ta xác định thuộc tính của thước đo mà chủ 
yếu là liệu các mệnh đề/câu hỏi của thước đo có “thống nhất” với nhau hay không. 
Thông thường các tác giả sử dụng chỉ số Cronbach' alpha từ 0,7 trở lên, song giá trị tối 
thiểu đề thước đo có thê sử dụng được là 0,63 (DeVellis, 1990). 

Phân tích độ tin cậy của thước đo thường được sử dụng cùng với phân tích nhân 
tố khám phá để quyết định các mệnh đề/câu hỏi cho từng thước đo. Lý tưởng nhất thước 
đo đủ cả ba điều kiện: 

- Các câu hỏi/mệnh đề của thước đo được phát triển dựa trên lý thuyết hoặc 
đã được các tác giả trước xây dựng và kiểm định. 

- Các câu hỏi/mệnh đề của thước đo “nhóm” cùng với nhau khi thực hiện 
phân tích nhân tô khám phá. 

: Các câu hỏi/mệnh đề có chỉ số Crobach”s alpha từ 0,7 trở lên, hoặc ít nhất 
cũng là 0,63. 

6.2. So sánh nhóm 

Một dạng nghiên cứu định lượng khá thông dụng là so sánh sự khác biệt giữa các 
nhóm về một hoặc một số chỉ số nào đó. Dưới đây là liệt kê các công cụ chính: 

- T — test (kiêm định t) : được sử dụng để so sánh hai giá trị trung bình. 

¬ ANOVA và ANCOVA (Analysis of Covariance) : Khi có nhiều hơn hai 
nhóm cần so sánh thì sử dụng ANOVA. Khi so sánh các nhóm, đồng thời kiểm soát tác 
động của một biến liên tục khác thì sử dụng ANCOVA. 

¬ MANOVA (Multivariate Analysis of Varlance): Tương tự như ANOVA 
nhưng được sử dụng khi có nhiều hơn một biến phụ thuộc và các biến phụ thuộc lại tương 


quan chặt với nhau. 
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Phụ lục 1. BẢNG CÂU HỎI KHẢO SÁT 


1. Bảng câu hỏi khảo sát “200 hộ gia đình ở vùng nông thôn ĐBSCL năm 2016” 
XIn kính chào quý ông (bả) 
Nghiên cứu “Các nhân tô tác động đến thu nhập hộ gia đình ” nhằm đánh giá thực trạng 
thu nhập của hộ gia đình nông thôn, từ đó đề ra một số giải pháp để có thể nâng cao thu 
nhập hộ gia đình. Rất mong ông (bà) dành chút thời gian để trả lời phỏng vấn hoặc điển 
câu trả lời vào bảng khảo sát dưới đây. Những thông tin này sẽ được hoàn toàn giữ kín. 
Phần A. Thông tin tổng quát 
(O1-110 110170010 15x41 2w 120v Gối cụt 0219906463044340A90008\0cptsooektlusswdicezrtocosat 
(221011 GHI: 0112. 1107213264202 1522ha63/sdl4626es06665a1420400esxcu0000644500000y92161998064982842Đ244% 
(Q3.- Trinh qO xan hóa 0ùa GHI HỖ 2i62xeccxy2042091440ybs6iitMei ceydieeeeeovdvSAvttbsk l4 2x 0A3 
4: Thanh phần: dân 10o:ofa CÚ BỘ Sessxiauaesa603010axuxasvossvsd0etwvBojkaa tuli6gpbecsviiu 
OẾ S0 nhan kiia0 của HO s24»: 4s ke 8isi00086003i0á004sg04asá0821a8ads.xeilitxsksS#u 
Q6. Số người lao động chính của hộ trong 12 tháng qua:.................‹---.--cc c2 <ss: 
Q7. Xin ông (bà) cho biết thông tin của từng thành viên trong hộ: 

Số |Họ |Quan |Giới Tuổi | Trình |Nghề |Kinh |Hình | Nghề 


thứ |và | hệ với | tính độ nghiệp | nghiệm | thức nghiệp 
tự |tên | chủ hộ học | chính nghề | phụ 
vấn nghiệp 
chính 


(@)|@2|J @) | @ |@) | (@) Œ@) (8) @) | (10) 
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Mã quy định các cột 
(3) Quan hệ với chủ hộ: 


1: Chủ hộ 2: Vợ/chồng 3: Con (gồm cả con đẻ, con nuôi) 
4: Cha/mẹ (cả cha mẹ của vợ/chồng, cha mẹ nuôi nếu cùng ở trong một hộ) 5: 
Ông/bà 6:Cháunộingoạ  7:Dâurể §: Anh/ch/em 9: Khác 
(4) Giới tính: 

0: Nữ 1: Nam 


(5) Tuôi: Ghi tuổi hiện tại 
(6) Trình độ học vấn: 
0:Khôngbiếtchữ I:CấpI 2:Cấp2 3:Cấp3 4: Trung cấp 
5: Cao đẳng 6: Đại học 7: Thạc sỹ 8: Tiến sỹ 
(7) Nghề nghiệp chính: 
1: Nông nghiệp (Nông nghiệp, lâm nghiệp, thủy sản) 
2: Công nghiệp và xây dựng 
3: Dịch vụ (Thương nghiệp, vận tải, dịch vụ khác) 
(8) Kinh nghiệp: G¡ số năm kinh nghiệm làm việc (nghề nghiệp chính) 
(9) Hình thức công việc: 


1: Tự làm cho gia đình 2: Làm thuê nhận tiền công, tiền lương. 
(10) Nghề nghiệp phụ: Việc làm chiếm thời gian nhiều thứ 2 trong 12 tháng 
qua 1: Tự làm cho gia đình 2: Làm thuê nhận tiền công, tiền lương. 


Phần B. Thông tin về khả năng tiếp cận tín dụng 

Q8. Trong 12 tháng qua, có ai trong hộ gia đình ông (bà) vay tiền tại các ngân hàng hay 
các tổ chức tín dụng không? 

(Nếu có thì làm tiếp câu Q9, Q10, Q11; nếu không thì chuyển sang câu Q12). 

Có. L] Không. 

Q9. Xin ông (bà) cho biết các khoản vay được vay từ nguồn nào? 

Ngân hàng nông nghiệp và PTNT L] Ngân hàng chính sách xã hội 

Ngân hàng khác, tổ chức tín dụng 

Các tổ chức chính trị xã hội 

Người cho vay cá thể 

Họ hàng, bạn bè 

Q1, C15 t1 Khöam. vaV là BaO THHH61177726is2249/8ã66csxcbtukdasubadissfsl36o oxi suooasCellàssakx 
Q11. Hộ gia đình ông (bà) vay các khoản tiền này để làm gì? 


Đâu tư cho sản xuât 


Xây, sửa chữa nhà 


TÔ 


Tiêu dùng, sinh hoạt 


Trả nợ 
Chữa bệnh 


Khác (Xin VUI lòng ghi 


Phần C. Thông tin diện tích đất căn hộ 

Q12. Gia đình ông (bà) có đất nông nghiệp, lâm nghiệp đề trồng trọt, sản xuất không? 
(Nếu có thì làm tiếp câu Q13, Q14; nếu không thì chuyển sang câu Q16). 

Có. L] Không. 

Q13. Xin ông (bà) cho biết diện tích thửa đất là boa nhiêu? Thuộc loại đất nào? 


(3) Diện tích đất lâm 
HỢ HDD Buyanscbz6As thyế gu dxtawftacblfidv©A( tucidDwatlrSxbsiaeiliesv.gf02kiquex (4) Diện tích đất 
từng ›tIS+CH 1P HAEOTESsxasttoeby01xyarttosaĐudtnsurcàtgGỏiDMilestsebBtuzbiienaaMdsbaj (5) Diện tích 


Q14. Gia đình ông (bà) có canh tác, sản xuất trên diện tích đất này không? 
(Nếu có thì làm tiếp câu Q15; nếu không thì chuyển sang câu Q16). 
L] Có. L] Không. 
Q15. Nếu không sản xuất thì ông (bà) cho thuê hay bỏ hoang? 
L] Cho thuê.  LI Bỏ hoang. 
Phần D. Thu nhập của gia đình 
Q16. Tổng thu và tông chỉ cho hoạt động sản xuất kinh doanh của hộ trong 12 tháng qua 


(tính từ thời điểm đu tra về trước) 


Nguồn thu Tổng thu | Tổng chỉ 


1. Trồng trọt 


Cây hàng năm 


Cây lâu năm 


Sản phẩm phụ trồng trọt (thân, lá, ngọn cây, rơm rạ,... 


Sản phẩm trồng trọt khác (cây giống, cây cảnh,...) 


2. Chăn nuôi 


Gia súc 
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Gia câm 


Sản phẩm khác (trứng, con giống...) 


Sản phẩm phụ chăn nuôi (phân, lông, da,...) 


3. Hoạt động dịch vụ nông nghiệp 


4. Lâm nghiệp và dịch vụ lâm nghiệp 


5. Thủy sản và dịch vụ thủy sản 


6. Các hoạt động sản xuất kinh doanh dịch vụ 
phi nông nghiệp 


7. Tiền lương, tiền công 


8. Các khoản khác (thu từ hái lượm, quà tặng, lãi 
tiết kiệm, tiền cho thuê nhà, lương hưu, trợ cấp... 


Tổng cộng 


Q17. Theo ông (bà), Nhà nước cần hỗ trợ nào đê giúp hộ gia đình phát triển kinh tế, nâng 
cao thu nhập? 
H Phát triển cơ sở hạ tầng H Vốn L] Kỹ thuật 
H Đắt sản xuất L] Tiêu thu sản phẩm, giá ồn định. 
Xin chân thành cảm ơn quý ông (bà) đã tham gia trả lời câu hỏi. Chúc giá đình ông 
(bà) thật nhiều sức khóa và hành phúc! 
2. Bảng câu hỏi khảo sát “Ảnh hưởng của hình ảnh điểm đến tới lòng trung thành của 
khách du lịch: Nghiên cứu trường hợp điểm đến du lịch TP. HCM” 
Chào Anh (Chị), Tôi là học viên cao học khóa 22 trường Đại học Kinh tế TP.HCM đang 
thực hiện đề tài luận văn cao học: “Ảnh hưởng của hình ảnh điểm đến tới lòng trung 
thành của khách du lịch: Nghiên cứu trường hợp điểm đến du lịch TP. HCM” 7rước 
tiên, xin cảm ơn Anh (Chị) đã nhận lời tham gia cuộc phỏng vấn của chúng tôi. Cũng xin 
lưu ý mọi thông tin trung thực do Anh (Chị) cung cấp không có quan điểm nào là đúng 
hay sai và tất cả đều rất có giá trị cho nghiên cứu của chúng tôi, vì thế rất mong nhận 
được sự hợp tác của Anh (Chị). 
Tiếp theo, xin Anh (Chị) vui lòng cho biết mức độ đồng ý của Anh (Chị) về các phát biểu 
dưới đây với quy ước: 


1 6; 3 4 5 
Rất không đồng | Không đồng ý Trung lập Đồng ý Rất đồng ý 
ý 
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(Lưu ý: Mỗi phát biểu chỉ chọn I mức độ, Anh (Chị) đồng ý ở mức độ nào thì khoanh tròn 


vào mức độ tương ứng, trường hợp chọn nhằm xin Anh (Chị) gạch chéo X để hủy chọn và 


chọn lại). 
Số | Các tiêu thức Mức độ đồng ý 
TẾ 1 |J2|3|4|5 
I. Môi trường cảnh quan 
| TP. HCM có khí hậu, thời tiết đễ chịu quanh năm I1 3: Is4;.| 5 
2 TP. HCM có nhiều cảnh quan đề tham quan, khám phá I J2|13|14|*s 
(sông, hồ, thác, biển, núi, vv) 
3 Môi trường sống tại TP. HCM ít bị ô nhiễm khói bụi,| 1 |2. 3|4|5 
tiếng ồn 
4 TP. HCM có nhiều tòa nhà, công trình xây dựng hiện đại | 1 |2 3|4|5 
5 TP. HCM có nhiều đường phó, đô thị sạch đẹp 1] Ø4 5-|54 
I. Môi trường kinh tế, chính trị 
6 | TP. HCM có tình hình chính trị ôn định | 2.5|-41|2 
7 TP. HCM có các quy tắc, luật lệ rõ ràng Í⁄‹ | 21 <ð.|.34-||SS 
8 Tại TP. HCM ít xảy ra trộm cướp và tệ nạn xã hội 1 213141» 
9 TP. HCM là trung tâm kinh tế phát triển, năng động 1/4iÍz2-II<”||-5E 
10 | Anh/Chị cảm thấy TP. HCM an ninh và an toàn 1717213034) 53 


II. Khả năng tiếp cận điểm đến 


I1 | Anh/Chị dễ dàng có được thông tin về điêm đến TP.HCM| 1 |2 3|4|5 

12_ | Anh/Chị dễ dàng đến TP. HCM bằng các phương tiện vận| 1 |2 3|4| 5 
chuyền khác nhau (ô tô, tàu thủy, tàu lửa, máy bay) 

13 Dịch vụ đưa đón khách du lịch (xe ôm, taxi, xích lô) tại 1 213141» 
TP. HCM thuận tiện 

14. | Chuyến đi của anh/chị đến TP. HCM thuận lợi A1 zj FT E E 

15_ | Chi phí đi lại, vận chuyên hợp lý ¡| I3 415 


IV. Lịch sử, văn hóa 


16 TP. HCM có các di tích lịch sử, đi sản văn hóa đặc sắc 1 213141» 
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17 TP. HCM có các sự kiện, lễ hội văn hóa đa dạng và hấp 213141» 
dẫn 
18 TP. HCM có nhiều bảo tàng lịch sử, văn hóa, nghệ thuật 213141» 
19 Hoạt động của khách du lịch không bị hạn chế bởi rào cản| 213141» 
ngôn ngữ 
20_ | Người dân TP. HCM thân thiện và hiếu khách 213|4|5 
V. Âm thực và mua sắm 
21 TP. HCM có nên ẩm thực phong phú, đa dạng Ji 415 
22_ | TP. HCM có nhiều món ăn độc đáo 3| 4-5 
23 Hoạt động mua săm tại TP. HCM đa dạng, văn minh 31415 
24 Phong cách phục vụ tại TP. HCM chuyên nghiệp 3414|* 
25 Giá cả ăn uỗống, mua sắm phải chăng ø: l|' 2|: *Š 
VI. Cơ sở hạ tầng 
26 TP. HCM có hệ thống giao thông phát triển 2l | 4Í 5 
SII Dịch vụ y tế, chăm sóc sức khỏe tại TP. HCM phát triển 2131415 
28 Mạng lưới thông tin, viễn thông tại TP. HCM phát triển 2| 3| 4| 5 
29 Hệ thống khách sạn, nhà hàng TP. HCM đa dạng và có 213141» 
chât lượng 
30 Hệ thống trung tâm lữ hành, công tu du lịch tại TP. HCM 21314|1s 
phát triên 
VH. Giải trí 
31 TP. HCM có nhiều địa danh để thăm thú, tìm cảm giác lạ 213141» 
32 TP. HCM có cuộc sông, hoạt động về đêm đa dạng (uống 2131415 
café, đi bar, coi kịch, nghe ca nhạc, xem phim, vv) 
33 TP. HCM có các hoạt động ngoài trời, thể thao phong phú 21314|1s 
34 | TP. HCM có hoạt động vui chơi, tiêu khiển đặc sắc 213|14|5 
VIII. Lòng trung thành của khách du lịch 


Km) 


Anh/Chị ưu tiên lựa chọn điểm đến TP. HCM khi có cơ hội 
đi du lịch 
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36 Anh/Chị sẽ trở lại TP. HCM khi có cơ hội l..|2. J3 |4 |Š 


37 Anh/Chị sẽ nỗ lực trở lại TP. HCM trong một ngày không | 1 2 13 |4 |5 


Xa 


38 | Anh/Chị sẽ giới thiệu người thân/ bạn bè đến dulichti |1 |2 |3 |4 |5 
TP. HCM 


IX. THÔNG TIN CHUYÉÊN ĐI 
39). Anh/Chị đã du lịch đến TP. HCM bao nhiêu lần (bao gồm cả chuyến đi này)? 
HIlần 
L1 2-3 lần 
14-5 lần 
H Trên 5 lần 
40) _ Lý do anh/chị đi du lịch TP. HCM? (có thê chọn nhiều câu trả lời) 
L] Tham quan 
L] Nghỉ dưỡng 
L] Vui chơi, giải trí 
L] Kinh doanh/ đi công tác 
L] Thăm người thân/ bạn bè 
L] Dự hội nghỊự/ triển lãm 
H Đám cưới/ tuần trăng mật 
H Mua sắm 
H Tham dự sự kiện (thể thao, văn hóa, nghệ thuật, vv) 
H Trên đường đến nơi khác 
JHI 81 sa 34i10a3) n8 "mm... ..ốốốẽốẽốẽố vẽ. ốc 
41) — Anh/Chị thường ở lại TP. HCM bao lâu? 
L Dưới l ngày 
L] 1-2 ngày 
L] 3-5 ngày 
H1 tuần 
H Trên I tuần 
42) - Anh/Chị du lịch đến TP. HCM bằng phương tiện nào? (có thể chọn nhiều câu trả 
lời) 
L] Xe máy 
L] Xe hơi 
L] Xe du lịch 
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43) 


44) 


45) 


46) 


L1 Taxi 

L] Tàu lửa 

L] Máy bay 

|] E0 (0 LiI:T0 v9 ri chà 6 4gb 81)8oax5, v4y4s2v06nnwxa6axb2a0006ã316 460x002 6012031 
Anh/Chị đi du lịch TP. HCM với a1? 

L] Một mình 

H Vợy chồng 

L Gia đình và con cái 

L] Bạn bè/ họ hàng 

L1 Đối tác kinh doanh 

L] Đòan du lịch 
Anh/Chị biết đến TP. HCM thông qua kênh thông tin nào? (có thể chọn nhiều câu 
trả 

lời) 

L] Internet 

L] Đại lý du lịch 

H Ấn phẩm quảng cáo (brochure) / sách hướng dẫn du lịch (travel guidebook)/ tạp chí 

L Bạn bè/ người thân 

H Quảng cáo truyền hình 

E2 HA (01010 Moy l2 003x922 /0M42A8601V04skle bsicblxsdad  su6sviegksoi tán c6 eYaZ SESEEclek 


Điểm du lịch nào tại TP. HCM mà anh/chị đã hoặc dự định đến? 

(có thể chọn nhiều câu trả lời) 
Ll Nhà hát lớn thành phố L] Khu du lịch Văn Thánh 
H Thảo Cầm Viên H Khu du lịch Bình Quới Thanh Đa 
H Chợ Bến Thành H Công viên văn hóa Đầm Sen 
Dinh Độc Lập Ll Khu du lịch Suối Tiên 
L] Trụ sở UBND TP L] Khu giải trí BCR quận 9 
H Nhà thờ Đức Bà H Vườn Cò Thủ Đức 
H Trung tâm mua sắm H Cần Giờ 


H Bảo tàng chứng tích chiến tranh LI Khu du lịch “Một thóang Việt Nam” 

L] Chùa bà Thiên Hậu  LÌ Địa đạo Củ Chi 

IE| KHE? (0H TOB.sicxxngf131260sv9w/0124⁄X669s6600i1461sgdf6Alasxbweuetllfoiaatsekeveb6 
Điều gì tại TP. HCM mà anh/chị có ấn tượng tốt nhất? 


X. THÔNG TIN CÁ NHÂN 47) 


Giới tính: 
L1 Nam HNữ 48) Tuổi: 
IR 18 - 35 36-55 
L] Trên 55 
49) Quốc tịch: 
L] Việt Nam L] Nước ngoài 
50) Tình trạng hôn nhân: 


32) 


53) 


H Chưa kếthôn 1 Đã kết hôn 51) Trình độ: 
L] Chưa học qua cao đăng - đại học 
H Cao đăng, đại học 
L] Sau đại học 

Nghề nghiệp: 

L] Học sinh, sinh viên 

L] Công nhân, nhân viên văn phòng 

L] Cán bộ, viên chức, giảng viên 

L] Kinh doanh, buôn bán 

LÍ E H¬ 0 so 2014 26/216asne 

Thu nhập hàng tháng: 

H Dưới 5 triệu đồng 

H Từ 5 triệu — dưới 10 triệu đồng 

H Từ 10 triệu - dưới 20 triệu đồng 

H Từ 20 triệu đồng trở lên 


TRẦN TRỌNG CẢM ƠN SỰ HỖ TRỢ CỦA QUÝ ANH/CHỊ! 
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Phụ lục 2. HƯỚNG DÂN SỬ DỤNG PHÁN MÉM SPSS CƠ BẢN 


IBM? SPSS° Statistics 


Version 20 
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1. Giới thiệu và cài đặt phần mềm SPSS 


1.1. Giới thiệu phần mềm SPSS 

SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình 
máy tính phục vụ công tác thống kê. SPSS được sử dụng rộng rãi trong công tác thống kê 
xã hội. 

Thế hệ đầu tiên của SPSS được đưa ra từ năm 1968. Thế hệ mới nhất là thế hệ 18 
được giới thiệu từ tháng 8 năm 2008, có cả phiên bản cho các hệ điều hành Microsoft 
Windows, Mac, và Linux /UNIX. 

SPSS là một hệ thống phần mềm thống kê toàn diện được thiết kế đề thực hiện tất cả 
các bước trong các phân tích thống kê từ những tính toán trong thống kê mô tả (liệt kê đữ 
liệu, lập bảng tần số, lập biểu đồ, tính các đại lượng thống kê mô tả,...) đến thực hiện những 
bài toán trong thống kê suy diễn (kiểm định, tương quan, hồi quy, ...) 

1.2. Cài đặt SPSS 

Cho đến nay, SPSS có rất nhiều phiên bản khác nhau, phiên bản mới nhất là phiên 
bản 25.0. Với những tính toán thống kê phổ biến ta có thể cài SPSS với một trong các 
phiên bản 14.0, 16.0, 18.0 hay 20.0,... Tất cả các phân tích trong tài liệu này được thực 
hiện trên phiên bản SPSS 20.0. 


1.3. Khởi động SPSS 
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Đề khởi động SPSS ta có thể thực hiện theo những cách sau: 
+) Kích đúp vào biểu tượng SPSS trên màn hình; 
+) Vào StartL]ProgramL] SPSS for WindowsLlISPSS 20.0 for Windows 


Sau khi khởi động, ta được giao diện sau: 


File Edit View Dala Transform Analyze DireciMarkeing Graphs UHilitiles Addons Window Halp 


2HBRk + #jàäi H54 E25 6 — 
_® 


IBM SPSS Statistics 20 ble: 0 of 0 Variables 


_ va |} 


|2 _JÌ 


IBM SPSS Statistics 


4 'What would you like to do? 


R ì 
@+ 
6 ị 


More Files... 
= —== CUsers\UserDesktop\luanvancongoc.sav 
D\OneDrive - UFIM\ppnc\lLuanvancongoc.xIsx 


© Run the tutorial 


© Type in data 


+ g 0E 


= _ j ng, 
mm © Open another type of file © Run an existing query 
= PSDRS © Create new query 
— 4 ulsing Database 
_— 8 =: Wizard 
16 
17 
18 
+q | [1 Don† show this dialog in the future ( œ.) 


Hình 1 

2. Nhập dữ liệu trong SPSS 
2.1. Nhập trực tiếp vào SPSSS 
Đề nhập trực tiếp một tập dữ liệu vào SPSS, ta thực hiện như sau: 

Bước 1. Tại cửa số IBM SPSS Statistics DaTa Editor, ta ấn vào nút Variable 
View để khai báo thông tin về các thuộc tính của từng biến trong file đữ liệu. Trong một 
bảng Variable View 

+) Các hàng là tên các biến; 

+) Các cột là tên các thuộc tính của biến. 
Các thuộc tính của một biến bao gồm: 

+) Tên biến (Name); Loại dữ liệu (Type) +) 

Số lượng con số hoặc chữ (Width) 

+) Số lượng chữ số thập phân (Decimals) 

+) Mô tả biến/nhãn biến (Lable) và nhãn trị số biến (Values) 

+) Các giá trị khuyết thiếu do người sử dụng thiết lập (Missing) 

+) Độ rộng của cột (Columns) 

+) Căn lề (Align) 

+) Thang đo của biến (Measure) 
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Khi khai báo hoặc chỉnh sửa các thuộc tính của biễn trong cửa số Variable View 
cần chú ý một số điểm sau: 

+) Tên biến phải bắt đầu bằng một chữ cái và không được kết thúc bằng một dấu 
chấm. Tên của biến là duy nhất, không được đặt trùng tên biến và tên biến không phân biệt 
chữ hoa, chữ thường. 

+) Loại biến: Variable Type xác định loại dữ liệu đối với từng biến. Theo mặc định, 
mọi biến mới được giả sử là dạng số. Phụ thuộc vảo loại đữ liệu được thu thập, ta có thể 
khai báo dưới những kiểu sau: dữ liệu là dạng số (numerie), dấu phảy (comma), dấu chấm 
(dotf), ghi chú khoa học (Scientifc notation), ngày tháng (Date), đô-la (Dollar), đơn vị 
tiền riêng (eustom curreney) và chuỗi (string). 
+) Nhãn của biến dùng để mô tả rõ hơn về tên của biến do tên của biến chỉ có độ dài 
tối đa là 8. Nhãn của biến có thể có độ dài đến 256 ký tự. 
+) Ta có thể gán nhãn cho từng giá trị của biến. Tính năng nảy đặc biệt tiện lợi khi 


ta dùng các số để mã hóa các biến định tính. Ví dụ.... Biến được mã hóa như vậy có thể 
dùng cho nhiều phân tích khác nhau. Hơn nữa, với nhãn của các giá trị, kết quả tính ra sẽ 
được trình bày rõ ràng hơn. 

+) Các giá trị khuyết thiếu do người sử dụng thiết lập (Missing). Những giá trị 
không thích ứng với kiểu khai báo của biến sẽ được coi là giá trị khuyết thiếu. Đối với biến 
kiểu số, các ô trồng được hiểu là giá trị khuyết và được đánh dấu bằng dấu phân cách thập 
phân. Nhiều thủ tục trong SPSS sẽ loại các giá trị khuyết ra khỏi các bước tính toán và các 
kết quả phân tích chỉ dựa trên phần số liệu không khuyết. 

Ta có thể nhập đến 3 trị số khuyết riêng biệt, một phạm vi khoảng cách trị số khuyết 
hoặc một phạm vi cộng với một trị sỐ khuyết riêng biỆt; 

Các phạm vi có thể được chỉ định cho các biến dạng SỐ; 

Các trị số khuyết cho các biến dạng chuỗi phải có độ dài không vượt quá 8 ký tự. 

+) Số đo của biến có thể ở thang đo định danh (Nominal), thang đo thứ bậc 
(Ordinal) hoặc thang đo khoảng, tỉ lệ (gọi chung là Scale): 

Thang đo định danh: Thang đo định danh dùng cho các biến định tính. Số đo của 
các biến này là các mã số để phân loại đối tượng. Giữa các mã số ở đây không có quan hệ 
hơn kém, chỉ dùng để đếm tần số xuất hiện của các biểu hiện. Một số ví dụ về thang đo này 
là: biến giới tính với các số đo là: Nam hoặc Nữ; biến màu sắc với số đo là: xanh, đỏ, tím, 
vàng,...; biến khu vực sống với các số đo: Thành phó, Thị xã, Nông thôn, Miền núi,... 

Thang đo thứ bậc: Thang đo thứ bậc thường dùng cho các biến định tính, đôi khi 
dùng cho cả biến định lượng. Trong thang đo này giữa các số đo của các biến có quan hệ 
thứ bậc hơn kém. Tuy nhiên, sự chênh lệch giữa các số đo không nhất thiết bằng nhau. Ví 
dụ biến đánh giá thái độ đối với chất lượng dịch vụ mạng Internet tại nhà có số đo là: 
Không hài lòng, hài lòng, rất hài lòng. 
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Thang đo khoảng: Thang đo thứ bậc thường dùng cho các biến định lượng. Thang 
đo khoảng là thang đo thứ bậc có các khoảng cách đều nhau. Các phép tính cộng trừ đều có 
nghĩa nhưng không có giá trị không xác định một cách chính xác và không thể lấy tỉ lệ giữa 
các số đo. Ví dụ số đo nhiệt độ, số đo chỉ số 1Q, chỉ số EQ.... 

Thang đo tỉ lệ: Thang đo tỉ lệ dùng cho các biến định lượng. Thang đo tỉ lệ là thang 
đo khoảng, hơn nữa thang đo này có giá trị không xác định một cách chính xác và có thể 
lấy tỉ lệ giữa các số đo. Ví dụ về thang đo này đơn vị đo tiền tệ (VND, dollar, pound, 
ven,...); đơn vị đo chiều đải (cm, m, km.,...); đơn vị đo khối lượng (kg, tấn, tạ, yến,...). 

Bước 2. Tại cửa số Data Editor, nhấn vào nút Data View để nhập từng dữ liệu 
trong mỗi ô. Trong bảng Data View +) Mỗi cột là mỗi biến Variable; 

+) Mỗi hàng là một đối tượng cases. 

Ví dụ 1. Cho dữ liệu 


Bảng 1 
Sau khi đã khai báo các thuộc tính của các biên trong cửa sô Variable View 
CFle Edil Viw Dala Transfbm Analze DiectMarkeing Graphs UHHỦes Addons WMindow Help 
F TW. ~+öẽ 1=: E EM: 'Ệ "@wW Y 
asH&  x is RNsxE°s.iàQ® 


Name Type Widh Decmas Label Vaues Missing Coumms Algn Measưe  Role. 
Numeric 8 2 None None 8 =Rinht 2 Scale % lnput 
Numeric 8 2 None None 8 Right 2 §cale % lnput 


Hình 2 


Ta vào cửa sô Data View nhập giá trị cho từng biến như đã được điều tra. 
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Eile Edit View Data Transforn Analyze DirectMarketin Graphs Utilities Add-ons Window Help 


'SHĐ Ea “l*: đã Ÿịj v 


'Visible: 2 of 2 Variables 


Hình 3 

Đề lưu dữ liệu vừa được tạo ra dưới đuôi của SPSS.sav, ta vào FilelSave as để 
đánh tên file cần lưu và thư mục để lưu trong máy tính. 
2.2. Đọc dữ liệu từ những file có sẵn 

SPSS có thể đọc dữ liệu từ rất nhiều kiểu file khác nhau. Ngoài dữ liệu đưới dạng 
file.sav của SPSS, SPSS còn cho đọc file đữ liệu dưới một số dạng thông dụng như file.xls 
(Excel File), file.txt (Text Eile) và file dữ liệu tạo ra từ một số phần mềm thống kê khác 
như file.dta (Stata File), file.wfl (Eviews Workfile), ... 
2.2.1. Đọc dữ liệu từ file.sav 

Đề đọc dữ liệu từ một file.sav, chăng hạn file dữ liệu Vidul.sav, ta vào EileLl 
OpenL]Data và chọn đến thư mục để file dữ liệu và mở file: 


-Eile. Edit View Data Transforr Analyze DirectMarketin Graphs Ulilitiss Add-ons Window Help | 


New 


Open Database 


Read Text Data... SỀ Output 


CỒ Script.. 


IÑEuari t Datahase 
Ra: riie xead C 
Eấf Rename Dataset... 


Display Data File Inforrnation 


Kích đúp Data... 
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File name: 
Files 0ff/pe: 'SPSS Statistics Œ.sav) _ 


—] Minimize string widths based on observed values 


Hình 5 


Chọn Vidul rồi kích Open. Ta được 


_FEile Edi View Data Transform Analyze DirectMarkeling Graphs UHHiHes Addons Window Help 


| |Visible: 2 of2 Variables 


x | y | wư | w | w | w | 


| 
1 6.00 40.00 
2 10.00 44.00 
4. j 12.00 46.00 

Izs| 14.00 48.00 
"Seeil 16.00 5200 
6 18.00 58.00 
T7 22.00 60.00 
8 | 2400 68.00 
8=] 26.00 74.00 

max. 3200 80.00 
iMw' 


Hình 6 
2.2.2. Đọc dữ liệu từ file .xIs 


Để đọc dữ liệu từ một file.xls, chăng hạn file dữ liệu Vidul.xlsx, ta vào File L] 


OpenL]Data và chọn đến thư mục để file đữ liệu và mở file: 


Filename:  |Vidu1xlsx 
Files 0ft/p8: Excel (*xIs, *xisx, *.xIsm} 


—| Minimize string widths based on observed valuesr 


(Retieue File From Reposlor... 
Hình 7 


Chọn Vidul rồi kích Open màn hình xuất hiện cửa sồ sau 
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C1Users\JseDesktop\THUCHANHWidu1.xIsx 


Worksheet: 


HH [  ] 


Maximum width for string columns: 


1 6.00 40.00 
Iiiesz | 10.00. 4400. 
=IAANII 12.00. 46.00 | 
IBE| 14.00. 48.00. 
iE=siss| 16.00. 52.00 
6 18.00. 58.00. 
7z || 22.00. 60.00. 
IiEe:;e | 24.00. 68.00. 
9g. ] 26.00. 74.001 
IE=øsl 32.00. 80.00. 
'TAN| | 


Hình 9 


2.2.3. Đọc dữ liệu từ file.txt 
Để đọc đữ liệu từ một file.txt, chăng hạn file dữ liệu Vidul.txt, ta vào File [lOpen 


[Data và chọn đến thư mục để file dữ liệu và mở file: 


File name: 


Files of type: 


[ï Minimize string widths based on observed values 


Hình 10 
Khi màn hình trên hiện ra hộp thoại sau ta ấn vào Open 
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628 R4II | 8ì 385 | Welcome to the text import wizardl 
630 240010734034 Z 
An This wizard will help you read data from your textfile and 


specify information about the variables. 


Doss your text file match a predefined forrnat2 


Gma)sz)ma 


Hình 11 


Ta ân Next, cửa sô sau xuât hiện 


Eem are your variables arranged? 


® Delimitled. _variaplas are delimited by a specific character (i.e.. comma, tab). 
© EixedwWidfh _variables are alignedin fixed width columns. 


r Are variable names included atthe top of your file2 


Hình 12 
Khi trên màn hình hiện ra hộp thoại sau ta chọn Yes cho câu hỏi Are variable 


names inelude at the top of your file? và sau đó ấn vào Next. Tiếp tục nhắn Next 


NextLINextLlFinish, ta được: 
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File Edit View Data Transform Analyze DirectMarketing Graphs UHilitỦles Add-ons Window Help 


: ¬h { § : đêm 
:“7 ft: by lên ñN ni 


x | y | w | w | w | w | 


_~ 


tittt 


Hình 13 

3. Lập bảng tần số và tính các đại lượng thống kê mô tả 
3.1. Lập bảng tần số 

Để lập bảng tần số cho các biến định tính hoặc đữ liệu định lượng có ít biểu hiện 
trong tập dữ liệu, chẳng hạn Ví dụ 1. 

Bước 1: Vào AnalyzeLlDescriptive Statistics LI Frequencies.... Màn hình hiện ra 
hộp thoại: 
File Edfi View Dala Transfrm Ảnalze DirectMarkeing Graphs UHHUss Addons Window Help 


Variable(s): 


Display frequency tables 


( =- } =--':. [Reest) (eanea) ( map.) 


Hình 14 
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Bước 2: Chọn các biến cần lập bảng tần số bên trái đưa vào khung Variable bên 
phải và ấn OK. 
Ta có thể tiến hành lập bảng tần số cho một biến hoặc một số biến cùng một lúc, 


chẳng hạn khi chọn biến Sex trong cửa số Output nhận được kết quả sau: Sex 


Valid 2 
Total 


Bảng 2 
3.2. Tính các đại lượng thống kê mô tả 
Trong một tập dữ liệu ta có thể tính các đại lượng thống kê mô tả của tập dữ liệu như +) 
Các đại lượng đo độ tập trung: trung bình cộng, trung vị, mode. 
+) Các đại lượng đo độ phân bó: tứ phân vị và phân vị thứ p. 
+) Các đại lượng đo độ phân tán: khoảng biến thiên, độ trải giữa, phương saI, độ 
lệch chuẩn. 


+) Các đại lượng mô tả hình dáng của tập dữ liệu: hệ số bất đối xứng Skewness, hệ 
số đo đọ nhọn Kurtosis. 

Trước hết ta nhắc lại định nghĩa và công thức tính toán những đại lượng này. 
+) Trung bình cộng đơn giản được tính bằng cách cộng tất cả các giá trị quan sát 


của tập dữ liệu rôi chia cho sô quan sát của tập dữ liệu đó. 


+) Trung vị là giá trị đứng giữa của tập dữ liệu đã được sắp thứ tự. Như vậy, không 
kê trung vị sẽ có 50% số quan sát của tập dữ liệu có giá trị lớn hơn trung vị và 50% số 
quan sát của tập dữ liệu có giá trị nhỏ hơn trung vị. 
+) Mode của một tập dữ liệu là giá trị xuất hiện nhiều nhất trong tập dữ liệu. 

+) Tứ phân vị chia tập đữ liệu đã sắp xếp theo trật tự tăng dần thành bốn phần có số 
quan sát bằng nhau. Tứ phân vị bao gồm ba tứ phân vị: tứ phân vị thứ nhất Q „¡ tứ phân vị 
thứ hai Q „ (chính là trung vị) và tứ phân vị thứ ba Q .: Trong tập dữ liệu có 25% số quan 
sát của tập đữ liệu nhỏ hơn hoặc bằng Q „¡ 50% số quan sát của tập dữ liệu nhỏ hơn hoặc 
bằng Q¿ và có 75% số quan sát của tập dữ liệu nhỏ hơn hoặc bằng Q 

+) Phân vị thứ p của một tập dữ liệu đã được sắp thứ tự là giá trị chia tập dữ liệu 
thành hai phần, một phần gồm p% số quan sát có giá trị nhỏ hơn hoặc bằng phân vị thứ p, 
phần còn lại có (100 p)% số quan sát lớn hơn hoặc bằng phân vị thứ p. 

+) Khoảng biến thiên của một tập dữ liệu là hiệu giữa giá trị lớn nhất và giá trị nhỏ 
nhất của tập đữ liệu. 
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+) Độ trải giữa của một tập dữ liệu là hiệu độ chênh lệch giữa tứ phân vị thứ ba và 
tứ phân vị thứ nhất của tập dữ liệu. 


+) Phương sai của một tập đữ liệu tổng thể, ký hiệu là F1”, được xác định bởi công 


nm_ 1 L]xIx¡nnH;, 
N¡n 
trong đó HÏ là trung bình của tổng thể và N là số quan sát trong tổng thẻ. 
+) Phương sai của một tập dữ liệu mẫu, ký hiệu là s ,ˆ được xác định bởi công thức: 
sn_1 HàDz:n xữ:, 
niin 
trong đó x là trung bình của mẫu và n là sỐ quan sát trong mẫu. 


+) Độ lệch chuẩn của một tập đữ liệu tổng thể, kí hiệu là H, là căn bậc hai của 


phương sai của tổng thể: 


ũ ịn Lx:nnh›. 
N¡nn 


+) Độ lệch chuẩn của một tập dữ liệu mẫu, kí hiệu là s, là căn bậc hai của phương 


sH /H: Llx¡ n xL]›. 


1¡iIn 


SaI mâu: 


Chẳng hạn, để tính những đại lượng thống kê mô tả như: trung bình, trung vị, 
phương sai, độ lệch chuẩn của các biến từ file Vidu3.sav. 

Bước 1. Vào Analyze[lDescriptive Statisties[lDescriptive... và khi màn hình sẽ 
hiện ra hộp thoại sau thì ta chọn biến MSAT đề đưa vào khung Variable(s) ở bên phải như 


Sau: 
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tạ Vidu3.sav [DataSet1] - IBM SPSS Statistics Data Editor -_ nRKEw 
Eile Edit View Data Transform Analyze DirectMarkeling Graphs UHlilỦles Add-ons Window Help 


£vsAT @MwTÐổ |. 
bị ¡ 


[1 Save standardized values as variables 


[ |IBM SPSS Statistics Processoris ready| j [ | [| 
Hình 15 
Bước 2. Ấn tiếp vào nút Options để chọn tính những đại lượng thống kê mô tả cho 
biến MSAT và màn hình hiện ra hộp thoại: 


hự 


Std. deviation i#f Minimum 
Variance Maximum 
Range S.E. mean 


Skewness 


() Variable list 
© Alphabetic 
© Ascending means 


© Descending means 


Hình 16 
Trong đó 
Mean Trung bình cộng 
Sum Tổng các giá trị của biến 
Std.Deviation Độ lệch chuẩn 
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Minimum Giá trị nhỏ nhất 
Maximum Giá trị lớn nhất 
'Variance Phương sai 
Range Khoảng biến thiên 
SE mean Độ lệch chuẩn của trung bình mẫu 
KurtosIs Hệ số đo độ nhọn 
Skewness Hệ số bất đối xứng 
Bảng 3 


Ta muốn tính đại lượng nào thì chọn vào đại lượng đó để hiện kết quả ra cửa số 
Oufput sau đó ân Conftinue và khi màn hình hiện ra hội thoại cũ thì ấn OK. Chẳng hạn, ta 
chọn như hình cửa số Output sẽ cho ta kết quả sau: 

Descriptive Statistics 


MSAT 427 330 770 241820 | 566.32 | 8671.191 
Valid N (Iistwise) 427 


Bảng 4 


Tính tứ phân vị hay phân vị thứ p tùy ý của tập đữ liệu, chẳng hạn cho biến MSAT: 
Bước 1. Vào AnalyzeLlDescriptive Statistics[lFrequencies... và màn hình hiện ra 


hộp thoại: 
đạ Vidu3.sav [DataSet1] - IBM SPSS Statistics Data Editor =-. 
File Edit View Data Transform Analyze DireciMarketng Graphs UHiilles Add-ons Window Help 


aH8IẰ « + #3 H SG Ẫ-: 


: of 2 Variables 
tạ Frequencies = 


var 


Variable(s): 


mã 
(gan. 
—¬ 


———_.. JWl Displayfrequencytables 


Hình 17 
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Bước 2. Chọn các biến định lượng cần tính bên trái đưa vào khung Variable bên 
phải, ấn Sfatisties và nếu ta không muốn đưa bảng tần số thì không chọn ô Display 
frequency tables. 

Bước 3. Khi màn hình hiện ra hộp thoại: 
tạ Frequencies: Statistics X.: 


Percentile Values r Central Tendency- 


 Quartiles i Mean 

i for: equal groups , ¡ Í⁄ĩ Median 
—] Percentile(s): l#' Mode 
l#' Sum 


-Ì_ L] Values are group midpoints 


rƑDispersion~ 


Distribution 

—] Std. deviation [—] Minimum [_Ì Skewness 

_ | Variance 1 Maximum L1 Kurtosis 

[_Ì Range ] S.E. mean 

Hình 18 
ta chọn những đại lượng cân tính, ân Conftinue trở vê hộp thoại trước ân OK. Ta được 

Statistics 
MSAT 


Valid 


Missing 


241820 
510.00 


Percentiles 570.00 


640.00 


Bảng 5 Kết 
quả tính toán này trên SPSS cho ta thấy: 


+) Trung vị của MSAT là 570, mode của tuôi là 530; 
+) Ba tứ phân vị là: Q 510L ; Q:H 570; Q;H 640.; 
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4. Biểu đồ 

4.1. Một số loại biểu đồ 

+) Biểu đồ thanh, biểu đồ tròn: áp dụng cho dữ liệu định tính 

TP) Biểu đồ hộp và râu, biểu đồ tần số, biểu đồ tán xạ, biểu đồ gấp khúc,...: áp dụng 
cho dữ liệu định lượng. 

4.2. Biểu đồ thanh 

) Biểu đồ thanh được dùng cho dữ liệu định danh hay thứ bậc. 

+) Chiều cao của mỗi thanh biểu diễn tần số hay tần suất của trường hợp biểu diễn 

bởi thanh đó. 

+) Có thê áp dụng đề biểu diễn cho một hay nhiều tập dữ liệu trên cùng 1 biểu đồ. 
Cách vẽ biểu đồ thanh 

Bước 1. Vào menu Graph[IBar đề mở cửa số Bar Chart 

Bước 2. Tại cửa số Bar Chart 

+) Chọn Simple: nếu biểu diễn tập dữ liệu một biến 

+) Chọn Clustered: nếu muốn biểu diễn tập dữ liệu của một biến được chia nhóm 
bởi một biến khác, các thanh đứng kể nhau 

+) Chọn Stacked: nếu muốn biểu diễn tập dữ liệu của một biến được chia nhóm bởi 
một biến khác, các thanh chồng lên nhau 
Vẽ biểu đồ thanh biểu diễn một biến: Đề vẽ biểu đồ thanh biểu diễn biến nghề nghiệp 
(Career) trong file Vidu2.sav ta tiến hành như sau 

Bước 1. Từ cửa số Data View Graphsil Legacy Dialogs[ Bar 


File Edit View Data Transforr Analyze DirectMarketin Graphs Utilities Add-ons Window Help 


| tử Chart Builder.. 
: Graphboard Template Chooser... 


91 12 VẤN Bar... 
92 12 3-D Bãi... 
93 12 Line... 
= 94 — 12 Area... 
3% 12 MPe.. 
__ _  Ñ. High-Low... 
97 12 
——==—— I8| Boxplot... 
98 12 BR Bopio 
— 88 : 12 Ki] Emor Bar... 
100 12 Population Pyramid... 
101 12 Scatter/Dot... 
_102_ kÍj Histogram... 
103 
104 
Hình 19 
Kích đúp Bar, ta được 


95 


| None 
None 12 


| 'None 2 

ằ Clustered Í 'None 42 

'None 42 

'None 2 

'None 42 

Í None 2 

'None 2 

( Summaries for groups of cases lMôNg | 12 

© Summaries of separate variables| . lNöng 42 
© Values of individual cases | | 


Hình 20 
Bước 2. Tại hộp thoại Bar Charts, chọn Simple. Tại khu vực Data in Chart Area 


chọn Summary for øroup of cases. Ấn Define. Xuât hiện cửa sô 


đâ› Des9 
® Des10 
2 Des11 
@® Des12 
2 Des13 
# Des14 
2 Des15 
# Des18 
@# Des17 
£ Des18 
đổ› Des19 
ể› Impress1 
ê› lImpress2 
ê› Impress3 
&› Impress4 
ê› Impress5 
ê› Impress8 
ê› lImpress7 
&› lImpress8 
ê› Impress9 


© % of cases 
© Cum. % 


©) Other s†atistic (e.g., mean) 


Variabls 


MMj— ——n] 
. Ghange 'Ghange Statstic. 


(*) Cateqgory Axis: 


IÑ Nestvariahles (no ampty rovs) 


Đs Columns: 
eX 
TP ¬ | 
đổ Place 
Hình 21 


Bước 3. Đưa biến Career vào khung Category Axis. Lựa chọn N of cases để trục 
tung biểu diễn tần số, % of eases đề trục tung biểu diễn tần suất. 
Bước 4. Ấn nút Title để đặt tiêu đề cho hình rồi ấn Continue. 
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đạ Titles 


Tiftle 


Line 1: |Nghề nghiệp 


=Faotnote 


(Gonanue)__ canesl J[_ Hep_., 


Hình 22 


Bước 5. Ấn OK. Ta được 


Nghề nghiê 


Count 


3 4 5 
Career 


Hình 23 
Ví dụ: vẽ biểu đồ thanh biểu diễn một biến được phân tách bởi một biến khác 
Đề vẽ biểu đồ thanh biểu diễn biến nghề nghiệp (Career) theo từng nhóm nam, nữ 
(biến nghề nghiệp được phân tách bởi biến giới tính) trong file Vidu2.sav ta tiên hành như 
Sau: 


Bước 1. Từ cửa số Data View Graphsil Legacy DialogsH Bar 


97 


Eile Edit View Data 


Transforr Analyze DirectMarketin Graphs Utiifies Add-ons Window Help. 
iÑ Chart Builder... 
—— = Graphboard Template Chooser... 


T L logs 
_#w _| | j 3D Bar... None 12 
93 BBÏ Line.. None 12 
84 lỊ [fB Area... 'None 12 
95 | | Mbe.. 'None 12 
—_%] 12 BlHún+ow.. None 12 
97 12 BãÑ soxpiot None 12 
98 12 ` None 12 
151 (12 lo hoang None 'None 12 
— 108 | 42 = Population Pyramid... Núge INúGs 12 
101 42 E8] scatter/Dot... None None 12 
102 His†ogram... 
103 | 
104 | 
_—_ —==--... 
Hình 24 
Kích đúp Bar, ta ko li 


II Clustered 


Data in Char† Are 


(®' Summaries for groups of cases 
(© Summaries of separate variables 
© Values of individual cases 


Hình 25 
Bước 2. Tại hộp thoại Bar Charts, chọn Clustered. Tại khu vực Data in Chart 
Area chọn Summary for group of cases. Ân Define. Xuất hiện cửa số 
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Bars Represent 


| 


(®) N of cases © % of cases 
© Cum.N © Cum.% 
©) Other statistic (e.g., mean) 


—— ÌVarlahle 


WfBiact i¬ri2niac (nan amintb¿ cnlitne1 


Hình 26 
Bước 3. Đưa biến Career vào khung Category Axis. Lựa chọn N of cases để trục 


tung biểu diễn tần số, % of cases đề trục tung biểu diễn tần suất. 
Bước 4. Ấn nút Title để đặt tiêu đề cho hình rồi ấn Continue. 


Hình 27 
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Bước 5. Ấn OK. Ta được 


Nghề nghiệp 


H0 Sex 


_W 
b 


Count 


3 


Career 


Hình 28 
4.3. Biểu đồ hình tròn 


N3) Biểu đồ tròn được dùng cho dữ liệu định danh hay thứ bậc 

+) Mỗi hình quạt biểu diễn tỷ lệ đóng góp của từng biểu hiện. 
Cách vẽ biểu đồ tròn 

Bước 1. Vào menu Graph[IPie để mở cửa số Pie Chart 


Bước 2. Tại cửa sô Pie Chart chọn Summary for group of cases. Án Define. Xuất 
hiện cửa số sau 


Bước 3. Đưa biến cần biểu diễn vào khung Define Sliee by. Ấn OK 
Ví dụ: vẽ biểu đồ hình tròn biểu diễn một biến 


Đề vẽ biểu đồ thanh biểu diễn biến nghề nghiệp (Career) trong file Vidu2.sav ta 
tiến hành như sau 


Bước 1. Từ cửa số Data View Graphsil Legaey Dialogsil Pie 
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Eile Edit View Data Transforr Analyze DirectMarketiny Graphs UHillties Add-ons Window Help 
fÙ Chart Builder... 
Dị Graphboard Template Chooser... 


EE] Population Pyramid... 


EE] Scatter/Dot... 
—t.-— KNCT1 Histogram... 
13 KNCT2 'Numenc 
14 Numeric 
Hình 29 
Kích đúp Plie, ta được 


Gì: ị 
© Summaries of separate variables 
© Valuss of individual cases 


Hình 30 
Bước 2. Tại cửa sô Pie Chart chọn Summary for group of cases. Ân Define. Xuất 
hiện cửa số sau 


Slices Represent 


() N of cases  % of cases 
© Sum ofvariable 


——¬ Variable 
j————————] 
———. Define Slices by: 

» 


Panel bự 


NÑ Nsstvariabis (no ernpt/ rovs) 
Columns: 


„mm 


IÑ Nest+ariables (no empty columns) 


Hình 31 
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Bước 3. 
Bước 4. 


Đưa biến Career vào khung Define Slice by. 
Ấn nút Tifle để đặt tiêu đề cho hình rồi ân Continue. 


tạ Titles 


Title 


Line 1: |Nghề nghiệp 


-Footnote 


Gmens)Lemet | Hep 


Hình 32 
Bước 5. Ấn OK. Ta được 
Nghề nghiệp 

Caraer 
BÍ 
_g 
a 
_Ằ 
ImE 


Hình 33 


4.4. Biểu đồ tần số (Histogram) 


+) Biểu đồ tần số: dùng cho biến định lượng liên tục nhằm biểu diễn phân phối của 


tập dữ liệu. 


+) Chiều cao mỗi thanh hình chữ nhật trong biểu đồ biểu diễn tần số của lớp tương 


Cách vẽ biêu đô 


tần số (Histopram) 


Bước 1. Chọn GraphL]Histogram 


102 


Bước 2. Chọn một biến định lượng vào khung Variable 

Bước 3. Nếu muốn hiển thị đường phân phối chuẩn thì chọn Display normal 
curve. Ân OK. 

Ví dụ ta cần vẽ biểu đồ tần số cho biến tuổi trong file Vidu1.sav. Trong bước hai ta 


chọn biến định lượng là X. Hình vẽ như sau 


Mean = 18.00 
Std. Dev. = 8.00 
N=10 


2a 


15 


b« 
° 
= 
® 
z 
LÊ. 
_ 
u. 
05 
00 
0 10.00 20.00 30.00 40.00 
X 
Hình 34 


4.5. Biểu đồ phân tán (Scatter plof) 
Biểu đồ tán xạ dùng đề biểu diễn mối quan hệ giữa hai biến định lượng. 
Cách vẽ biểu đồ phân tán (Seatter plot) 

Bước 1: Chọn GraphLlScatter/Dot. Được cửa sỐ sau 

Bước 2: Tại cửa số Seatter/Dot, chọn Simple nếu vẽ biểu đồ cho một cặp biến. 
(Ovelay biểu diễn nhiều đám mây đơn cùng biểu đồ..... ) 

Bước 3: Chọn biến đưa vào khung Y-axis (giá trị là tung độ của điểm), biến đưa 
vào khung X-axis (giá trị là hoành độ của điểm) 

Ví dụ ta cần vẽ biểu đồ phân tán trong file Vidu1.sav. Hình vẽ như sau 
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^ 6000 


5.00 10.00 15.00 20.00 25.00 30.00 35.00 


Hình 35 
5. Tìm hàm hồi quy tuyến tính, kiểm định mô hình, ước lượng hệ số hồi quy 
Ta cần tìm hàm hồi quy tuyến tính, kiểm định mô hình, ước lượng hệ số hồi quy 
trong file Vidu1l.sav. Ta thực hiện như sau 
Bước 1. Từ cửa số Data View chọn Analyze[l RegressionH Linear 
Eile Edit View Data Transforr Analyze DirectMarketin Graphs Uliliies Add-ons Window Help 


Reports 
Descriptive Statistics 


` 
L : 
Tables ' (Visible: 2 of 2 Variables 
Compare Means lÀ 
1 General Linear Model } 
2 Generalized Linear Models * 
3 Mixed Models } 
_ | €orrelate } 
5 16.00 : 1 = : 
= 18 00 Tan [E] Automatic Linear Modeling 
7 2200 PUÙ - 
8 7.11. : [f] Curwe Estimation... 
Classi l = 
9 b Partial Leas† Squares... 
h———— Dimension Redudion  " 
10 SESNg : [“] Binary Logistic... 
k „ Multinomial Logistic 
12 Nonparametric Tests | ME = 
i4 s 
+2 Forecasfing ` Ordinal... 
Suirvival › | M&| Probit.. 
Hình 36 
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Kích đúp Linear, ta được 


WLS Weight: 


— 


Hình 37 
Bước 2. Đưa biến Y sau Dependent và biến X vào Independent(s). Chọn 


Statistics ta được bảng sau 


Reuression Coefficients Model fit 
R squared change 
Desrcriptives 
Part and partial correla†ions 
Collinearity diagnosfics 


Casewise diagnosfics 
 Dutllers oulside : . standard dewialions 
Ø All cases 


Hình 38 
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Tích vào Confidenee intervals. Ấn Continue 


Kích OK, ta được các bảng sau 


Model Summary 


Adjusted R Square | Std. Error of the Estimate 


a. Predictors: (Constant), x 
Bảng 6. Tóm tắt mô hình 
ANOVA2 


Regression 1586.694 
Residual 47.306 


Total 1634.000 


a. Dependent Variable: y 
b. Predictors: (Constant), x 
Bảng 7. Phân tích phương sai 
Coefficients° 
Unstandardized Standardized |t Sig.  |95.0% Confidence 


Coefficlents Coefficlients Interval for B 


Beta 
Bound | Bound 


(Constant) | 27.125 : 13.705 1.000 


a. Dependent Varlable: y 
Bảng 8. Ước lượng hệ số hồi quy 
6. Đánh giá độ tin cậy các thang đo bằng Cronbach °s alpha 
Trong phần này áp dụng cụ thê cho file Vidu2.sav. Ta kiểm định thang đo của môi 
trường cảnh quan (MTCQI,..., MTCQS) như sau 
Từ cửa số Data View: Chọn Analyze[IScaleFIReliability Analysis...như sau: 
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Reports E1 EŒ . 
R CÀ 

Descriptive Statistics ` EG ÁIc 1 `= 
Tables } Visible: 101 of 101 Variables 
Compare Means "|. MTCG3 j Mm 
General Linear llodel '|V 3 
Generalized Linear Models + 3 
Mixed Models } 2 
€orrelate ` 3 
Regression KAL<) 3 

5 4 
L0glinear ME! ị 
Neural Nelworks ` h š 
Classify } 1 š 
Dimension Reduction P L- 


Nonparametric Tests 


¿ Multidimensional Unfolding (PRE 
EM ¿ Multidimensional Scaling (PROX: 
Surviwval Là Ei ộ : R 
= Multidimensional Scaling (ALSC¿ 
Mulfiple Response ' 
Missing Value Analysis... 
Reliability Analysis... gã s2 „ 
Mulfinle Inintatian l2 
Hình 39 


Kích đúp Reliability Analysis, ta được 


~ 


Scale label: 


Hình 40 
Trong hình 40, chọn nhóm biến môi trường cảnh quan (MTCQI...., MTCQ5) đưa 


vào hộp lItem, xuât hiện như sau: 
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Hình 41 


Trong hình 41. Chọn Sfatisties, màn hình xuất hiện như sau: 


Inter-Item 
Correlafions 
Covariances 


ANOVÀ Table 

( None 
Variances © Ftest 
Covariances ©) Friedman chi-square 
Correlafions © Cochran chi-square 


Hotellings T-square Tukeys test of additivity 
Intraclass correlation coefficient 


Model: |TWoWayMbWed *| Typs: |©onslstency v| 


Confiđence lntewall9s |%  Testvalue: l0 


Hình 42 
Trong hình 42, chọn Scale và Scale if Scale item deleted của hộp Deseriptives for, 
sau đó chọn Continue màn hình xuất hiện như hình 41. Chọn OK, ta được 
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Reliability Staftistics 


Cronhach's 
Alpha N nf ltams 


Item-Total Statistics 


Scale Cnrrected Cronbhach's 
Scale Mean if Variance if ltam-Total Alnha if ltem 
ltm Deleted ltam Deleted €orrelatian Daletedl 


Bảng 9 


Sau khi chạy Cronbach “s alpha từng yếu tố, biến KNTCI bị loại vì hệ số tương 
quan biến - tổng (Corrected Item — total Correlation) là -0,138 (<0,3). 

Kết quả đánh giá Cronbach “s alpha cho thấy các thang đo đều có hệ số alpha đạt 
yêu cầu (> 0,6), thấp nhất là thang đo khả năng tiếp cận điểm đến (KNTC) có alpha = 
0,638 và cao nhất là thang đo cơ sở hạ tầng (CSHT) có alpha = 0,836. 

7. Phân tích nhân tố khám phá (EFA) 

Trong phần này áp dụng cụ thê cho file Vidu2.sav. Ta tiến hành như sau 

7.1. Sử dụng SPSS thực hiện phân tích EFA 


Từ cửa số Data View: Chọn Analyze[IDimension ReduetionFlFaetor...như sau 


File Edit View Data Transform Analyze DirectMarketing Graphs Uiiliiles Addons Window Help 


Reports ' Na 


Descriptive Statistics 
Tables 


Compare lleans 


' 

' 

' 
General Linear Model ' 
Generalized Linear Models + 
Mixed Models ' 
Correlate } 
Regression } 
Loglinear ' 
Neural Networks } 
Classify } 


G4» 0 16 ®> >> 0 C2 +>ị | 
G + G0 G0 NI 02 Gò, 


LEÏ Gorrespondence Analysis... 
4| Optimal Scaling... 


Nonparametric Tests 


Survwal 


Và 
' 
' 
Forecasting ' 
' 
' 


Multiple Response 
Missing Value Analysis... 


kÂiinlna Iranidtatian › 


Hình 43 


! 
'[Fador... 


= Í @M 0 [ 
Processor is readyl | | [|  Ï 


Kích đúp Factor, ta được 
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(»j Selection Variable: 

Sổ 
|_ (mạ 

—_) ---- [Rua)(Gma)(ssa) 


Hình 44 
Trong hình 44, đưa tất cả các biến đặc trưng vào hộp Variables (trừ biến bị loại ở 
kiểm định Cronbach”s Alpha và các biến của thước đo LLT, xuất hiện như sau: 


x 


Hình 45 
Chọn Deseriptives, sẽ xuất hiện 


Statistics 
Univariate descriptives 
Initial solution 


Correlation Matrix 


Coefficients [LÏ Inverse 
8ianificance levels FÌ Reproduced 


Hình 4ó 
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Trong hình 4ó, ta chọn Univariate descriptives và Initial solution trong hộp 
Statisties. Trong hộp Correlation Matrix, chọn Coefficients và KMO. Nhắn Confinue, 


chọn Extractfion sẽ xuât hiện 


Display 
®) Correlation matrix Unrotated factor solution 
© Covariance matrix : 


Esdtract 
( Based on Eigenvalue 


Eigenvalues greater than: 


© Fixed number of factors 
Factors to extract: 


Maximum lterations for Convergence: s | 


Hình 47 
Trong hình 47, ta chọn Principle components trong hộp Method. Trong hộp 
Analyze, chọn correlation matrix. Trong hộp Display, chọn Unrotated factor solution 
và Scree plot. Trong hộp Extract, chọn Based on Eigenvalue và Eigenvalues greater 
than 1. Trong hộp Maximum Iterations for Convergence 25. Nhân Continue, chọn 


Rotation sẽ xuât hiện 


BI 


© Direct Oblimin ( Promax 
Della: 0n Kappa 4 


Rotated solution (f'Loading plot(s} 


... Y6. ‹ 


Maximum lterations for Convergence: 


Hình 48 
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Trong hình 48, ta chọn Varimax trong hộp Method. Trong hộp Display, chọn 
Rotated solution và Losding plot(s). Trong hộp Maximum Iterations for Convergence 
25. Nhân Confinue, chọn Scores sẽ xuất hiện 

#3 Factor Analysis: Factor Sco... 


Í Save as variables 
rMethod- 


(9) Regression 
© Bartlett 
( Anderson-Rubin 


Hình 49 
Trong hình 49, bên dưới Factor Analysis, ta chọn Save as variables và Display 
factor score coefficient matrix. Trong hộp Method, chọn Regression. Nhắn Confinue, 
chọn Option sẽ xuất hiện 
đà Factor Analysis: Options 


rƑMissing Values- | 


©) Exclude cases pairwise 
( Replace with mean 


Coeficient Display Format- 
[_] 8orted by size 
IV/ Suppress small coefficients 


Absolute value below. 


Hình 50 
Trong hình 50, chọn Exclude cases listwise. Trong hộp Coefficient Display 
Format, chọn Suppress small coefficient. Đối với Absolute value Below, chọn giá trỊ 


bao nhiêu tùy thuộc vào cỡ mâu nghiên cứu. Lưu ý 


Cỡ mẫu Giá trị chọn (Factor loadings) 
Lớn hơn 350 0,3 
Từ 100 đến 350 0,55 
Nhỏ hơn 100 0,75 
Bảng 10 


Trong ví dụ trên cỡ mẫu 360 ta chọn 0,3. 
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Nhắn Confinue, chọn OK ta có toàn bộ kết quả 
Factor Analysis 


[DataSet1] C:\Users\User`\Desktop`\ luanvancongoc. sav 


Descripftive Statfistics 
[| Mean | StdDeviaton |AnawsisN_ 

MTCG1 3.41 .881 380 

MTC@2 3.56 .818 360 

MTC83 3.48 .a02 380 

MTC@4 3.53 .810 380 

MTCQ5 3.53 .B14 380 

KTCT1 3.72 ./83 360 

KTCT2 3.98 ./83 380 

KTCT3 3.52 .824 360 

KTCT4 3.72 .33 380 

KTCTS5 3.82 .r22 360 

KNCT2 3.75 1.058 360 

KNCT3 3.78 .a38 380 

KNCT4 3.86 1.043 360 

Bảng 11 
Rotated Component Matrix” 
€pmponeni 
1 | 7 | 3 | A4 | 5 | B8 | Ứ _| 

MTC01 .806 
MTCQ2 .fTT 
MTCQ3 ./54 
MTCQ4 .881 
MTCQ5 .8B7 
KTCT1 888 
KTCT2 ./83 
KTCT3 ./70 
KTCT4 ./54 
KTCT5 878 
KNCT2 ./58 
KNCT3 ./13 
NCT4 ./43 
LSVH1 .840 
LSVH2 s11 
LSVH3 ./BB 
LSVH4 882 
LSVH5 ./04 


Bảng 12. Kết quả phân tích nhân tố khám phá 
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Ta chọn các kết quả cần thiết phục vụ cho phân tích. 
7.2. Hệ thống kiểm định cho EFA 
7.2.1. Kiểm định tính thích hợp của EFA 

KMO and Bartletf's Test 


KaIser-Meyer-Olkin Measure of Sampling Adequacy. AVb 


Approx. Chi-Square Bartletts Test ofSphericty  dỶ 3239.022 


SIg. 
: 496 


.000 


Bảng 13 . Kiểm định KMO và Bartlett 
Dựa vào kết quả ta có hệ số KMO là 0,759 (0,5) và sig= 0,00 <0,05, nghĩa là các 
biến quan sát có tương quan tuyến tính với nhân tố đại diện. 
7.2.2. Kiếm định mức độ giải thích của các biến quan sát với nhân tố 


Total Variance Explained 


Component Inttial Eigenvalues Extraction Sums of Squared Rotation Sums of Squared 
Loadings Loadings 


Cumulative : Cumulative %0 % of Cumulatrv 


% Vartance 


12.087 
10.429 
§.516 
1237 
6.723 
3.690 


12.087 
22.515 
31.032 
38.268 
44.991 
50.681 
416 | 55443 
3039 | 5§482 
%1 | 300 | 61484 | 
§0§ | 2526 | 64010 | 


Bảng 14. Tổng phương sai được giải thích. 
Phân tích EFA mang lại 7 nhóm nhân tố tác động đến LLT. Hệ số tải và hệ số tin 
cậy Cronbach Alpha đạt tại Eigenvalue = 1,524 và phương sai trích đạt 55,443 % (> 0,50). 
Vì thế kết quả EFA là đáng tin cậy và có thê sử dụng cho phân tích hồi qui ở bước theo. 
7.2.3. Kết quả mô hình EFA Rotated 


Component Matrix* 


Component 


MTCQ3 
MTCQ4 


MTCQ5 
KTCTI 
KTCT2 
KTCT3 
KTCT4 
KTCT5 
KNCT2 
KNCT3 
KNCT4 
LSVHI 
LSVH2 
LSVH3 
LSVH4 
LSVH§ 
ATMSI 
ATMS2 
ATMS3 
ATMS4 
ATMS5 
CSHTI 
CSHT2 
CSHT3 
CSHT4 
CSHT5 
GTI 
GT2 
GT3 
GT4 


.162 
.826 
.809 
.749 
.717 


.699 
./63 
.770 
.154 
.678 


Bảng 15. Ma trận nhân tô xoay. 


.640 
./I1 
./68 
.682 
.704 


Dý CS} 
./58 
.718 
.670 
6022 
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.154 
609] 


.667 


./88 
san 
.760 
.695 


./58 
vi 2 
.143 


Trong bảng 15. Cho biết các đặc trưng đều có hệ số tải nhân tố lớn hơn 0,5. Có 7 nhân tố 

+) Nhân tố 1. Bao gồm các biến CSHT2, CSHT3, CSHTI1, CSHT4, CSHT5. Ta đặt 
tên cho nhân tố này là CSHT (F1). 

+) Nhân tố 2. Bao gồm các biến KTCT3, KTCT2, KTCT4, KTCT1, KTCT5. Ta 
đặt tên cho nhân tổ này là KTCT (F2). 

+) Nhân tố 3. Bao gồm các biến LSVH3, LSVH2, LSVH5, LSVH4, LSVHI. Ta 
đặt tên cho nhân tổ này là LSVH (F3). 

+) Nhân tố 4. Bao gồm các biến ATMS2, ATMS1, ATMS3, ATMS4, ATMSS. Ta 
đặt tên cho nhân tổ này là ATMS (F4). 

+) Nhân tổ 5. Bao gồm các biến MTCQ2, MTCQ3, MTCQ4, MTCQ5, MTCQI. Ta 
đặt tên cho nhân tô này là MTCQ (F5). 

+) Nhân tố 6. Bao gồm các biến GT1, GT3, GT2, GT4. Ta đặt tên cho nhân tô này 
là GT (F6). 

+) Nhân tố 7. Bao gồm các biến KNCT2, KNCT4, KNCT3. Ta đặt tên cho nhân tố 
này là KNCT (F?). 
7.2.4. Thực hiện phân tích hồi quy đa biến 


Để nhận diện các yếu tố ảnh hưởng đến hình ảnh điểm đến, mô hình tương quan 


tổng thê có dạng: 
LTTHfF,F,F,F,F,F,FLI ›; Ạ s 6 ;Ll 


Trong đó 
+) LTT là biến phụ thuộc; 
+) F1, F2, F3, F4, F5, Fó, F7 là biến độc lập. 


Vì thế, chúng ta có thể dự đoán mô hình hồi qui bội với 7 nhân tố như đã xác định 


trong các chương trước có dạng như sau: 
LTT HH HH HH HH HL HH HH HŨH,.,F zF; 33F 
4F4 sãF 6F 7F? 

Trong đó các biến đưa vào phân tích hồi quy được xác định bằng cách tính điểm của 
các nhân tố (Factor score). 
Nhân tổ thứ ¡, được xác định 

F¡iL w Xii[L w X¿¿ HH LH...w Xáx 

Với 
+) ww: Hệ số nhân tố được trình bày trong ma trận hệ số nhân tô (Component Score 
Coefficient). 


+) X :¡ Biến quan sát trong nhận tố ¡. 
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Đối với các biến độc lập, SPSS tính sẵn trong Data view khi phân tích nhân tố khám 
phá như hình 51 


HÀ Jntitled4 [DataSet3] - I PSS Statistics Data Edit 


x 


= (— - 
Nah= _s g ản.: _ÐÑÑ 


| Visible: 107 of 107 Variables 


1.05695. -.22270. 

1.06304. .56903. -1.40693. 
23646. T974. 1.05480. 

11183. — -88893 - 


112725. 

142337 ~ -.55591. -.02590 

- 86906. -53831 .61134. 

-2 02780. .89018. - 15160. -1.20010. 
- 00507 30466 03281 - 11836 
28203. 56181 .80585 1.32571 

| 1.37632. 205093. .67201. 


Hình 51 
Trong hình 51, FACI_ 1 là F1, FAC2_1 là F3, FAC3_1 là F3, FAC4_1 là F4, được 


xác định theo cách tính điểm của nhân tố, tương tự cho các nhân tố còn lại. 
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Phụ lục 3. HƯỚNG DẪN SỬ DỤNG PHẢN MÈM EVIEW 8.0 


1. Màn hình Eviews 


Thanh công cụ 
Màn hình Eviews 


Cửa sô Command 


Cửa số Workfile 


2. Các kiểu dữ liệu thường dùng 
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2.1. Số liệu theo thời gian: là các số liệu thu thập tại nhiều thời điểm khác nhau trên cùng 
một đối tượng. Chẳng hạn như số liệu về GDP bình quân của Việt Nam từ 1998 — 2006 
được cho trong bảng sau: 


Năm | 1998 | 1999 | 2000 | 2001 | 2002 | 20038 | 2004 | 2005 | 2006 


Bảng 1 


2.2. Số liệu chéo: là số liệu thu thập tại một thời điểm ở nhiều nơi, địa phương, đơn vị, 
khác nhau. Chẳng hạn như số liệu về GDP bình quân trong năm 2006 của các nước Brunei, 


Campuchia, Indonesia, Lào, Malaysia, Myanmar, Philippines, Singapore, Thái Lan, Việt 


1361 


Nam được cho như sau: 


Singapore | 30162 
Thái Lan 959 


655 


Bảng 2 


2.3. Số liệu hỗn hợp: là số liệu tổng hợp của hai loại trên, nghĩa là các số liệu thu thập tại 


nhiều thời điểm khác nhau ở nhiều địa phương, đơn vị khác nhau. Chắng hạn như số liệu 
về GDP bình quân của các nước từ 1998 — 2006. 


Nước — J1998 999 D000 D001 D002 D003 D004 D005 Ð006_ 


Myanmar JI34 H73 178 
Thái Lan 1829 1985 1967 
Việt Nam B60 B74 jkW1 i3 40 39 bõ3 Bl8 B5 


Bảng 3 


3. Nhập dữ liệu 
3.1. Nhập trực tiếp vào Eview 
Đề minh họa cho phần này, ta xét các ví dụ sau: 
Ví dụ I. Bảng 4 dưới đây cho biết số liệu về GDP bình quân đầu người của Việt Nam trong 
các năm 1998 — 2006. 
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Năm | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | 2005 | 2006 


Bảng 4 


Ví dụ 2. Bảng 5 dưới đây cho biết số liệu về doanh số của một công ty. 


ca 


7810 
8712 
9280 
10144 
11567 


Bảng 5 
Ví dụ 3. Bảng 6 dưới đây cho biết số liệu về năng suất (Y, đơn vị tạ/ha) và mức phân bón 
(X, đơn vị tạ/ha) cho một loại cây trồng tính trên một ha trong 10 năm từ 1988 đến 1997, 


|Y |40 |44 |46 |4§ |52 |58 |60 |68 |74 |80 _ 
Bảng 6 
Ví dụ 4. Bảng 7 dưới đây cho biết số liệu về doanh thu (Y), chi phí cho quảng cáo ( X2 ), 
tiền lương của nhân viên tiếp thị (X3 ) của 12 công nhân (đơn vị triệu đồng). 
[STTỊI |2 |3 |4 |5 |6 |7 |3 |9 |10 |1 |1 | 
Bảng 7 
Mở Eview, để nhập dữ liệu: Chọn FileLINewLTWorkfile, ta có màn hình như sau: 
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& EViews - "Mu 
File Edit Object View Proc Quick Options Add-iins Window Help 


.Dated - regular frequency vị 


Irregular Dated and Panel 


workfles may be made from Startdate: . 
Unstructured workfiles by later Enddate: ˆ 
specifying date and/or other : 
identiRer series, 'Fortnight 
.Ten-day {Trimonthly) 
”. 
'Daily - 5 day week 
~Workfile names (aptional)—————— 'Daily - 7 day week 
WE: | (Daily - custom week 


ntraday 
| er date 


Hình 2 


Tuỳ vào kiêu dữ liệu cân khảo sát, ta có thê chọn được các kiêu sau : 


Dated — regular frequency 
Multi — year : Số liệu nhiều năm 
Annual : Số liệu năm 
Semi — Amnual : Số liệu nửa năm 
Quarterly : Số liệu theo quý 
Monthly : Số liệu theo từng tháng 
Bimonthly : Mỗi tháng 2 lần/2 tháng 1 lần 
Fortnight : Hai tuần lễ/15 ngày Ten 
— day (Trimonthly) : 
Weekly : Số liệu theo từng tuần 
Unstrueture / Undate : Số liệu chéo 
Đề nhập dữ liệu ở ví dụ 1, ta chọn các khai báo như trong hình 3 như sau: 
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~Workfile structuire type——————, -Date spedfication 


Dated -regulzr frequency vị  P94ency: Amul  v. 


Irreqular Dated and Panel : 

workfiles may be made from Startdate: ¡ 1998 
Unstructuired workfiles by later Ẻ 
specifying date and/or other Etddsle: | 2006 
tendn : 

~Workfile names (optional)———— 


Hình 3 
Đề nhập dữ liệu ở ví dụ 2, ta chọn các khai báo như trong hình 4 


Hình 4 


Đề nhập dữ liệu cho ví dụ 3, ví dụ 4, ta có thể khai báo báo như trong hình Š. 
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Hình 5 
Trong ô Observations ta nhập cỡ mẫu (số các quan sát) 


Chăng hạn như trong ví dụ 3, ta nhập 10 rồi nhẫn OK ta được hình 6 


Ẻ R — 1 = 
Sample:110 — 


Hình 6 
Đề nhập số liệu ta chọn : Quiek —Empty Group (Edit Series), màn hình xuất hiện 
một cửa số như hình 7. Trong đó 
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- Cột obs phi thứ tự quan sát. 


- Các cột kê tiêp đê khai báo các biên và nhập sô liệu. 


Hình 7 


Ví dụ nhập sô liệu cho biên Y vào cột sô 2, ta nhâp chuột vào đâu cột này và gõ tên 


biến Y sau đó nhấp Enter và lần lượt gõ các giá trị vào các ô bên dưới có ghi chữ NA. 
Chăng hạn như trong ví du 3 và ví dụ 4, ta khai báo và nhập số liệu tuần tự như trong các 
hình sau : 


B K ch On, 
[uee[ec[osea] Freeze | 
l 


__ 8000000  40.00000. 


10.00000 44.00000. | 
1200000  48.00000 | 
14.00000 48.00000 _ | 
18.00000 52.00000. 
_— T8.00000 5800000 - 
2200000  80.00000. 
2400000  88.00000. 
2800000  74.00000, 


| 3200000  8000000Ƒ —— ] L 


Hình 8§ 
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3.2. Nhập từ Excel và Word có sẵn 

Giả sử ta có sẵn File Excel vidu 4.xls chứa số liệu của ví dụ 4. Khi đó ta thực hiện 
các bước Import sau: 

Mở chương trình Eviews chọn File —› Open —>Eoreign Data as Workfile...như 
sau 


Programs in Add-ins folder... 
Te File... 


0untitled.wf1 

1 dàonedrive - uf...\chuongtrinheview.prg 
2 c\users\user\desktop\desoT1.wfT 

3 c\users\user\desktop\solieu_thanh.wf1 
4 c:\users\user\desktop\solieu.wfT 

5 c;\users\user\downloads\solieu.wf1 

6 c:\users\user\desktop\untitled.wf1 

7 c:\users\user\onedrive - ul...\vidu.WwfT 


Hình 10 


L5 


@ - * 4 .+ ThisPC + Desktop v Ớ Search Desltop 2 


Organize * New folder + li @ 
^ Name : Date modified Type ve 
*Â Hemegroup Fl MS Excel 2013 9/15/201411:14AM  Shortcut 
EBMS 0utlook 2013 9/15/201411:14AM_ Shorcut 
; Thị PC FỂÈl MS Power Point 2013 9/13/201411I4AM Shortcut 
-ka Desktop MSWord 2013 9/15/20141114AM Shortcut 
.Ýl Documents 8Ÿ) Nero Expres: 9/15/201411I6AM  Shortcut 
-# Downloads (#Ð OneDrive - UFM - Shortcut 5/21/2019809PM  Shortcut 
-l Music Ễ: Thời khóa biểu.docx 7/17/2019 10.45 AM MicrosoftWordE 
.È Pictures ÑÊ Thong-tin-can-tham-khao-cua-de-tai.d.. 5/2i/2019835PM_ MicrosoftWordF 
-Ä Videos (đÌ toan-ung-dung,pdf 7/17/20193/47PM  FoxitReaderPDF 
lu CKK.AIS(C;) (Ñˆ UniKey64 9/15/201411:11AM  Shocut 
ca HUONG (P:) LÊ vidu4 xi 7/18/2019 10:30 AM 


ca ĐONG (E) [ar: Zalo 10/3/2018852PM  Shortcut " 
vw< | > 
File name. vidu4xlsx vị |AIfiles (2) v 
{ ]Update default directory Cancel 
Hình 11 


Chọn Open ta được kết quả như trong hình 12. Trong cửa số này chúng ta thấy có 
hai cột số liệu của X và Y tương ứng trong SheetlI của File vidu 3.xIs 


- Cell Range 
(®) PredeRined range Sheet: — Sheetl v 
=) 
= vị Startrcelli $A§1 [R [El 
CC) Custom range : 
SIEEH Mp6 Endcel: $C§13 LIẾN: 
= 


Hình 12 
Cuối cùng chọn EFiïnish ta được kết quả như trong hình 13 
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0 XS bong Order. Name _ 
c 

resid 

x2 

&A x3 

y 


Hình 13 
Lưu ý. Các bước trên được gọi là trích lọc dữ liệu từ một file dữ liệu có sẵn. 
Ta có thể thực hiện copy trực tiếp từ một file Word hoặc Excel 

Mở của số Group của Eview 


Hình 14 
Từ file excel hoặc file word bôi đen rồi copy và paste vào file trên. Chắng hạn ta có 
file word ta thực hiện như sau: 
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Ymeweete[3 -j# # # [3Ì [: 


f#X  DeleteTable 
HỆ Distribute Rows Evenly 

F Detribute Columns Evenly 
Border Styles ` 


| AuntnFit 


Hình 15 


Ta pasfe vào của sô Group như sau 


Ì + 


12 Select all 
Edit +/- 
Sample +/- 
Transpose +/- 
- ObslD +/- 


Hình 16 Và 
được kết quả như sau: 
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4. Vẽ đồ thị 

4.1. Vẽ biểu đồ phân tán số liệu. 

Mục đích của việc vẽ đồ thị này cho phép ta đánh giá sơ bộ về mối quan hệ cũng 
như hình dung được dạng hàm (mô hình) giữa hai biến với nhau. Đề vẽ đồ thị phân tán của 
hai biến, chẳng hạn như trong ví dụ 3 ta vẽ đồ thị phân tán của Y và X. 


Từ của sô Eviews chọn Quick—>Graph 


le) OBicetjIEunt|Naiej|LEIee 
Group Members 
Spreadsheet 
Dated Data Table 


Descriptive Stats 
Covariance Analysis... 
N-Way Tabulation... 
Tests of Equality... 
Principal Components... 


Correlogram (1)... 
Cross Correlation (2)... 
Long-run Covariance... 
Unit Root Test... 
Cointegration Test 
Granger Causality... 


Label 


Ta được 


129 


-Details 
Granh data; Raw data 


E1- Graph Type 


[#l-Frame & Size mm—————— 
Hì-AuexsaSei XC Fitlines: None v |.Options. 
(+i-Legend 

#i- Graph Elements 

£#i- Quick Fonts 

£#i- Templates & Objects 


Axisborders: None vị 


Multiple series: Single graph 


thösfep Sân [=—] 


Hình 19 
Ta chọn Secatter rồi nhắn Ok, ta được đồ thị phân tán dữ liệu như sau 
1E) Grc 2 Workfile: UNTIT À 
90 


Hình 20 
Làm tương tự như các bước trên ta có thê vẽ các loại đồ thị khác. 


4.2. Vẽ đường hồi quy tuyến tính. 
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~Details 
ị l Basic type Gyanhrlatla  Raw data 
(‡I-Frame & Size TEUNrEIrmhm——rxirnaazr 
ixl- Axes & Scaling Fitlines: | Regression Line v ,/Optians. 
‡I-Legend : ` ' 
hi ¿d4 Multipls-serizs: .- Single graph 
Quantile - Quantile 
Boxplot 
. Undo Page Ediis.. [_œ || can - 


Hình 2I 
Thực hiện các bước tương tự như trên. Ta chọn Seatter—>Regression line rồi nhấn 


Ok, ta được đồ thị thể, hồi quy như sau: 


Hình 22 


5. Tìm hàm hồi quy tuyến tính mẫu (SRF) 
Muốn tìm hàm hồi quy tuyến tính mẫu của Y theo X chẳng hạn như trong ví dụ 3 có 


nhiều cách làm sau đây tôi chỉ giới thiệu một cách đơn giản nhất. 
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Từ cửa số Command ta gõ dòng lệnh ls y e x và nhấn Enter. Ta có bảng hồi quy 


sau mả ta gọi là bảng Equation 
6 EVi 


File Edit Object View Proc Quicek Options Add-ins Window Help 


_= 


:UNTITLEDzUn 


Dependent Variable: Y 
Method: Least Squares 
Date: 07/18/19 Time: 11:04 
Sample: 1 10 

Included observaftions: 10 


Variable Coefficient 


® 27.12500 
X 1.859722 


Std. Error †-Statistic 


1.979285 13.70458 
0.101321 18.38082 


R-squared 0.971048 Iean dependent var 
Adjusted R-squared 0.987430 S.D. dependentvar 
S.E. of regression 2431708 Akaike info criterion 
Sum squared resid 4730556 Schwarz criterion 
Log likelihond -21.95980 Hannan-Quinn criter. 
F-statistic 2688.3312 Durbin-Watson stat 
Prob(F-s†tatistic) 0.000000 


Hình 23 


Các kết quả ở bảng trong hình 23 lần lượt là 


- Dependenf Variable : Tên biến phụ thuộc 


- Method: Least Sqạuares : Phương pháp bình phương tối thiểu (nhỏ nhất). 


- Đafe — Time : Ngày giò thực hiện 
- 9ømple : Số liệu mẫu 1 — 10 


- Included observafions : Cỡ mẫu là 10 ( 


- Cột Variable : Các biễn giải thích có trong mô hình (trong đó C là hệ số bị chặn) 


- Cột Coefficienf : Cá trị các hệ số hồ quy [HH] ;;;. - Cột Š⁄đ. Error : Sai số chuẩn 


của các hệ sô hôi quy. 


seLln-,L b — 


- Cột £ — Šfafistic : Giá trị thống kê t 
tương ứng: t,[1 ! 2 W 


seL] n.L] seL] n,L] 


(Trong đó t là đại lượng ngẫu nhiên có phân phối Student vớ bậc tự do (n— 2)). 


II” 


SỐ các quan sát) 


xJvar [ñ. [ 


=)t L Orkfile: No ti 
B| [Yew|Proc|objedi [Erint|Name |Erecze| [Estimate |EForecast|5tzts] Resids | 


Prob. 


0.0000 
0.0000 


57.00000 
13.47428 
4.791920 
4.852437 
4.725533 
1.783613 


varLÌ nˆL 


- Cột Prob. : Giá trị xác suất (p — value) của thống kê t tương ứng 
p_value,[IP tLÏ ñt;p_value,L];n P t[] n tL 

- R— Squared : Hệ số xác định mô hình (R?) 

- Adjusted R — Squared : Hệ số xác định có hiệu chỉnh (R? ) 


^ 


- $E. oƒ regression : Giá trị ước lượng cho ø:[ (sai số chuẩn của hồi quy) 


- 9wm squared resid : Tông bình phương các sai lệch (phần dư) ( RSS ) 

- Log likelihood : Tiêu chuẩn ước lượng hợp lý (Logarit của hàm hợp lý) 

- Durbin — Watson sfaf : Thông kê Durbin — Watson 

- Mean dependent var : Giá trị trung bình mẫu của biến phụ thuộc 

-.§.D. dependení var : Độ lệch chuẩn mẫu của biến phụ thuộc 

- Akaike inƒo criterion : Tiêu chuẩn Akaike 

- $chwarz inƒo criferion : Tiêu chuẩn Schwarz 

- F— Sfatistic : Giá trị của thông kê F 

- Prob (F — Stafistic) : Giá trị xác suất (p-value) của thống kê F tương ứng p_ value 
HPEFL]I 1F statisticL] 

Với F là biến ngẫu nhiên có phân phố Fisher có bậc tự do (k— 1,n — k). 

Muốn thể hiển đường hồi quy. Từ bảng Equation—>View—>Representations, ta có 


kết quả sau: 
(=J Equation: UNTITLED_ Workfile: UNTITLED:zUntitled\ -_ñx 


AMev]noc]obea]|nun|hane|rres]|Eamte]roreeea| Su; ae, 


Estimation Command: 


Y=C(1)+C(2?*X 


Substituted Coefficien†s: 


Y = 27.125 + 1.85972222222*X 
Hình 24 


6. Một số hàm trong Eviews 
LOG(X): In(X) 
EXP(X): e* 
ABS(Œ) : giá trị tuyệt đối của X 
SOR(X): căn bậc 2 của X 
(@SUM(X) : tổng của các X 
(@@MEAN(X) : giá trị trung bình của X 
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(@VAR(X): phương sai của X 

(@COV(X.Y) : hiệp phương sai của X, Y 

(@COR(X,Y) : hệ số tương quan của X, Y 
7. Cách tìm một số dạng hàm hồi quy 

Giả sử ta có số liệu của các biến Y và X tại thời điểm t. Nếu tìm hàm hồi quy của Y, 
theo X và Y.¡n (biến trễ thì câu lệnh sẽ là y e x y(-1). 

Giả sử ta có số liệu của các biến Y và X. Nếu tìm hàm hồi quy của In(Y) theo In(X) 
thì câu lệnh sẽ là log(y) c log(x). 

Giả sử ta có số liệu của các biến Y và X. Nếu tìm hàm hồi quy của Y theo Xxfhì câu 
lệnh sẽ là y e sqr(%). 

Giả sử ta có số liệu của các biến Y và X. Nếu tìm hàm hồi quy của Y theo e* thì câu 
lệnh sẽ là y e exp(). 

Giả sử ta có số liệu của các biến Y và X. Nếu tìm hàm hồi quy của Y theo X và X? 
thì câu lệnh sẽ là y e x x^2. 

Giả sử ta có số liệu của các biến Y và X. Nếu tìm phương trình sai phân cấp 1 của Y 
theo X thì câu lệnh sẽ là d(y) e d(x). 

Giả sử ta có số liệu của các biến Y và X. Nếu tìm phương trình sai phân cấp k của Y 
theo X thì câu lệnh sẽ là d(y,k) e d(x,k). 

Nếu cần tìm hàm hồi quy nhưng không sử dụng hết các quan sát của mẫu, chăng 
hạn ta tìm hàm hồi quy của Y theo X trong ví dụ 3 nhưng ta chỉ sử dụng 7 cặp quan sát đầu 
tiên. Khi đó ta thực hiện các thao tác như sau: 

Từ bảng Equation chọn Estimate, ta có màn hình sau. Ta chỉnh 10 thành 7 

Equation Estimation x 


Specification  Options 


Equation specification 


Dependent variable followed by list of regressors including ARMA 
and PDL terms, OR an explicit equation like Y=c(1)+c(2)*X. 


Estimafion settings 
Method: Ls - Least Squares (NLS and ARMA) v 


Sample: 17 


œK Cancel 


Hình 25 
8. Tìm ma trận tương quan và ma trận hiệp phương sai của các hệ số hồi quy 


8.1. Ma trận tương quan giữa các biến 
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Giả sử ta có mẫu gồm các biến Y, X2, X3 cho trong ví dụ 4. Đề tìm ma trận tương 
quan của các biến này ta thực hiện như sau: 
Từ cửa số Eviews chọn Quiek —›Group Staftisties —Correlations. 
Khi đó màn hình xuất hiện như sau: 


Sample... 
Generate Series... 
Show ... 


¡ z Graph ... 
27a Empty Group (Edit Series) 


Series Statistics 


Descriptive Statistics 
Covariances 
__ €orelatiom  - 


Cross Correlogram 


Estimate Equation... 
Estimate VAR... 


Johansen Cointegration Test 
Granger Causality Test 


Hình 26 
Nhấp chuột sẽ xuất hiện cửa số sau 
~List of series, groups, andjor series eXpressioì§————————— 
x2 x3 | 


l8... Caneel 


Hình 27 
Sau đó nhắn OK, ta được ma trận tương quan như sau 
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€ 


1000000 0782281 0904827 - 
0782281 1000000 0480173 
.904827 | 0.480173 | 1.000000 


Hình 28 

Ý nghĩa: Ma trận tương quan (Correlation) cho biết xu thế và mức độ tương quan 
tuyến tính giữa hai biến trong mô hình. Nhìn vào bảng ma trận tương quan ở trên ta thấy hệ 
số tương quan của X2 và X3 là 0.480173 khá nhỏ điều đó có nghĩa là X2 và X3 có tương 
quan tuyến tính ở mức độ yếu và tương quan thuận. 
8.2. Ma trận hiệp phương sai giữa các biến 

Giả sử ta có mẫu gồm các biến Y, X2, X3 cho trong ví dụ 4. Để tìm ma trận tương 
quan của các biến này ta thực hiện như sau: 
Từ cửa số Eviews chọn Quiek —›Group Statistics —+Covarianees Khi 
đó màn hình xuất hiện như sau: 


Sample... 

Generate Series... 

Show... 

Graph ... 

Empty Group (Edit Series) 


Series Statistics 


Descriptive Statistics 


Estimate Equation... C 0variances 


Estimate VAR... Correlations 
Cross Correlogram 
Johansen Cointegration Test 
Granger Causality Test 


Nhâp chuột sẽ xuât hiện cửa sô sau 
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~List of series, groups, andj/or series eXpressions - 


Lx | [mm' 


Hình 30 
Sau đó nhắn OK, ta THỊ ma trận Nn Klan như sau 


=ƒ“—— | 
Y — | ——— | 84.52778 | ^ 
X2 8989444 1807639  6.180558 _ | 
— 845278 61805586  10.30556 _ | 
v 
<‹ > 
Hình 31 


Ý nghĩa: Ma trận hiệp phương sai (Covariances) cho biết phương sai các biến nằm 
trên đường chéo chính. 
8.3. Ma trận hiệp phương sai giữa các hệ số hồi quy 

Giả sử ta có mẫu gồm các biến Y, X2, X3 cho trong ví dụ 4. Đề tìm ma trận hiệp 
phương sai giữa các hệ số hồi quy, ta thực hiện như sau: 

Từ cửa số Equation chọn View —>Covariance Matrix. 
Khi đó màn hình xuất hiện như sau: 
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a 


File Edit Object View Proc Quickk Options Add-ins Window Help 
ls ycx2x3 


Representations 
Estimation Output 
Actual,Fitted Residual 
ARMA Structure... 


Pa SldEmor tStaisic  Prob. 


= B253073 5181823 0.0008 

Coefficient Diagnostics 0328573 7628105 0.0000 

Ẹ : ẻ 0410384 1159572 0.0000 
Residual Diagnostics 

Stability Diagnostics Mean dependent var 141.3333 

S.D. dependent var 23.20789 

Label Akaike info criterion 5.824358 

zzzuz” Schwarz criterion 5.945585 

-31.9846815_ Hannan-Quinn criter. 5.779476 


sqưare0d 8 


| Log likelihood 
_ F-statistic 180.3545 Durbin-Watson stat 2527238 
-_Prob(F-statistic) 0.000000 


BE NT TT TÍN II Errcrurrr=n lien 


Hình 32 
Nhấp chuột, ta được ma trận hiệp phương sai giữa các hệ số hồi quy như sau 


39.10093 | -1.416429 


-1416428  0.107980 


I 
416429 " 
0727129  -0.084747 
| 
| 


Hình 33 

Ý nghĩa: Ma trận hiệp phương sai của các hệ số hồi quy (Coeffieient Covariance 
matrix) cho biết phương sai các hệ số hồi quy nằm trên đường chéo chính, các thành phần 
còn lại là hiệp phương sai của những hệ số trong mô hình. 

Chăng hạn, ví dụ 4 bên trên. Nhìn vào ma trận hiệp phương sai bên trên ta có 


phương sai của các hệ sô hôi quy là: 


varLl n,LÏ 39.10093:varLÏn n›LÏo.1oz9o;varLÍn n.LÏ 0.168415. 
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9. Bài toán tìm khoảng tin cậy cho các hệ số hồi quy (Khoảng tin cậy đối xứng) 
Khoảng ước lượng các hệ số hồi quy tổng thể 


nnnnmn ;cseLlnnm,LH,ˆ c[Ín,Lpn;¡ni2...kị cn.n 


k 


Trong đó C là giá trị được dò trong bảng phân phối Student với bậc tự do là (n-k). 
Giả sử ta có mẫu gồm các biến Y, X2, X3 cho trong ví dụ 4. Để tìm khoảng tin cậy 
cho các hệ số hồi quy tổng thể, ta thực hiện như sau: 


Từ cửa số Equation chọn View —>Coeffieient Diagnosties—>eonfidence 
Intervals... 
Khi đó màn hình xuất hiện như sau: 


File Edit Object View Proc Quick Options Add-ins Window Help 
ls yc x2 x3 


Estimation Output 
Actual,Fitted,Residual 
ARMA Structure... 


TOIREREIRTDOMRNS Sid Error tStaistic  Prob. 


Covariance Matrix 
8.253073 5.181823 0.0008 


Scaled Coefficients 


Residual Diagnostics 
Stability Diagnostics Confidence Ellipse... 
Variance Inflation Factors 


Label 
Coefficient Variance Decomposition 


II Log likelihood -31.94815 
F-statistic 180.3545 Wald Test- Coefficient Restrictions... 


FToD-stattsiic) 0000000 GnauayjVuskiecTa+t-LehoodRsbi.. 


Redundant Variables Test - Likelihood Ratio... 
Factor Breakpoint Test... 


Hình 34 
Nhấp chuột, ta được kết quả sau 
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() Equation: UNTITLED Workfile: VIDU4:Vidu4\ HỘ — 
AVev]moc]objsa]|nam]nane] re] [rtmtejmecot] ii seo: 


Coefficient Confidence Intervals 
Date: 07/18/18 Time: 11:31 
Sample: 1 12 

Included observations: 12 


90% CI 95% CỊ 99% CI 
Variable Coefficient Low High Low High Low High 
C 32.27726 2081487 43.73985 1813183 48.42270 1195580 52.59872 
x2 2505729 1803418  3.108040 1782446 3249012 1437922 3573538 
x3 4.758893 4008414 5510973 


3.830341 5.687045 3425015 6.092372 


Hình 35 


Bảng trên là kết quả ước lượng khoảng tin cậy của các hệ số hồi quy tổng thể ứng 
với độ tin cậy 90%, 95% và 99%. 


10. Bài toán dự báo 


Khoảng dự báo giá trị trung bình 


Ey ¡xIn xeDHnnvy .n cs yLÏ,E:yˆ,n cs vLÏˆ,LTn 


II 
Khoảng dự báo giá trị cá biệt 


L] 


Y;nnY ›n Cse vLÌ 0L] Yụ LÌ:v „n Cse vLÌ oL] Ys Lln 


IR IR 


Đặt YnsLl Y ;Sel ;Ll se vLÌ oHY ,LÏ:se2 [ se vLÌ LÌ:c L @qtdist inn” 


nha „nh kHUn 


MH L] Equation 


Xét ví dụ 4, để tìm khoảng dự báo giá trị trung bình và giá trị các biệt của Y khi X; 
20,X:L16, với độ tin cậy 95%, ta thực hiện như sau: 
Bước 1. Nhập thêm dữ liệu vào bảng Group để dự báo 


Từ bảng Workfile, chọn Proe —›>Structure/Resize Current Page... Màn hình sau 
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ls ycx2x3 


Si 


THECHI FOQC... 


Append to Current Page... 


Contract Current Page... 
Reshape Current Page 
Copy/xtract from Current Page 
Sort Current Page... 


Load Workfile Page .... 
Save Current Page... 
Rename Current Page .... 
Delete Current Page 


lmport 
Export 


Hình 36 
Nhấp chuột, màn hình sau xuất hiện. Ở ô quan sát (Observations) ta điều chỉnh 12 
thành 13) như sau: 


Lx)} [ mm j 


Hình 37 
Nhấp OK. Từ bảng Group. Ta chọn Edit+/- „ sau đó nhập X›[1 20,X; H16 vào hàng 
số 13 có chữ NA như sau: 
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Object View Proc Quick Options Add-ins Window Help. 


Hình 38 Tắt 
cửa sô Group. 


^ 


Bước 2. Tính giá trị Y ;nY ;se Y„L] o H Y ,LI H sel;se 


vH L H se2. Từ bảng Equation. Chọn forecast màn hình xuất 


hiện như sau 


Dependent Variable: Y 
Method: Least Squares 
Date: 06/07/13 Time: 21:31 


-Forecast of 
| Equation: LINTTTLED 
Series namEs———————————————————— 
Forecastname; YDB Static forecast : 
S.E. (optional):  Se| 4S H ` 
[_]Structural (anore ARMA) 
&aRcH(optiona: — || | RBjcefuwxetxymsE các 
GGExtiag021266:0/2010/20011251ĐSAVESEAI 
- Đutput 


[Z]Forecast graph 
[JÌForecast evaluation 


[JlInsert actuals for out-of-sample observations 


Lx«]  [ma) 
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Hình 39 
Ô Forecast name ta đổi Yf thành Ys, ô S.E. (optional) ta gõ Se1. Nhắn OK. 


Hình 40 
Tắt đồ thị dự báo 
Từ bảng Workfile. Chọn Genr và gõ lệnh như sau rồi nhắn Ok. 
län| Workfile: VIDUS - (c\userz\trungdong\desktop\vidu5.wf1) " x 


Range: 1 13 = 13obs Filter: * 
Sample:1 13 — 13obs 


se2=sqr((se 1)2-{mh. @se)“2) 


Hình 4I 


Bước 3. Tìm khoảng dự báo 
- Dự báo giá trị trung bình 
Từ bảng Workfile. Chọn Genr và gõ lệnh như sau rồi nhấn Ok. 
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Workfile: VIDUS - (c\users\trungdong\desktop\vidu5.wf1) : 


(View Proc| Qbje| | int|save|Detailsx/-| |show | Fetch| Store Dslee | Genr|sample] - 
Range: 113 — 130bs 


Generate Series by Equation 


Generate Series by Equation @@ø- 
-Enter equation 
cantrentrungbinh=ydb+|@qtdist(0.375,3)*se2 


-Enter equal0n—————————————— 


canduoitrungbinh=ydb-@atdist(0.975,3)#se2 


Hình 42 
Dự báo giá trị cá biệt. 
Từ bảng Workfile. Chọn Genr và gõ lệnh như sau rồi nhắn Ok. 
Worlfile: VIDUS - (c\users\trungdong\desktop\vidu5.wf1) 


View foc|0jef||Bint)Seve|Deaisx/-|Shơu | fekh| iere|DaleejGem|Sangle 
Range: 113 — 130bs 
Sample:† 13 — 13 0bs 


Generate Series by Equation Generate Series by Equation 


D | 
l5 


- Enter equafion 


-Enter equafion 
canduoicabiet=ydb-@atdist(0.375,9)®se1 cantrencabiet=ydb+(@qtdist(0,375,3)*se 1 
- Sample— 
IỆk| | 
| 


Hình 43 

Đề mở các kết quả trên cùng một bảng ta thực hiện như sau: 

Từ của số Workfile, nhấn phím Ctrl rồi chọn canduoicabiet, cantrencabiet, 
canduoitrungbinh, cantrentrungbinh sau đó nhân Enter, ta được kết quả sau (lưu ý nhìn 
vào hàng thứ 13) 
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mrneli=-iel= -Ji=e=i=ri.Tei== 


CANDUOITRUNGBINH TH TH .. CANTRENCABIET 


121. T080. 128.2287 115. 3422 4445925 [7 
1424540. 152.0782. 1370112 157.5210 
1025283 114.3482 9762467. 119.2519. |_ 
164.3718. 172.7359. 158.5791. 1785286. |“ 
9792959. 108.4185 9270930. 113.6386 
173.1950. 183.4530 187.9186. 188.7314 
57.5713 165.5131 151.8541 1744403 - 
125.3324 133.8141 1195157. 139.4308. 
128.3832 135.5748 1222354. 141.7225: 
143.7224 150.3043 1373782 58.8485. 
150.9932 157.0569. 1444752 1463.5748. 
134.9086. 147.5786. 130.1920. 52.2952 
153.9864. 163.0754. 148.3989 1686630 _ 
4 | II | ' 
Hình 44 
Vậy khoảng dự báo giá trị trung bình và giá trị cá biệt của Y là 
CANDUOITTB CANTRENTB CANDUOICB CANTRENCB 
153.9864 163.0754 148.3989 168.6630 


11. Định mẫu 

Trước hết ta xét ví dụ sau 
Ví dụ 5. Bảng số liệu sau cho biết số liệu về lượng hàng bán được (Y tân/tháng), giá bán 
(X ngàn đồng/kg) ở 20 khu vực bán và được khảo sát tại hai nơi là Thành phố và Nông 
thôn. 


1 0 
D 6 |1 
3 : 6 |0 
4 # |4 
5 7 |0 
6 ï |a 5ð |1 
7 4 |0 
8 7 |1 
9 8 |0 
10 8 |1 


Bang 8 
Trong đó Z là biến giả với Z. = 0 : khảo sát ở nông thôn; Z.= I : khảo sát ở thành thị 
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Có nhiều trường hợp ta không sử dụng hết các số liệu của mẫu ban đầu, hay chỉ cần 
khảo sát sự phụ thuộc khi biến giả nhận một giá trị nào đó. 
Đề định mẫu lại, từ cửa số Workfile chọn Sample, màn hình xuất hiện như 
Sample no p—=— 


Sample range pairs (or sampie object ta copy) - 


Hình 45 
Chăng hạn ta chỉ khảo sát 15 mẫu đầu tiên và ở khu vực Thành phố ứng với Z = I. 
Ta khai báo vào ô Sample range parrs và IF condition nhưtrong hình sau 


Sample x |==_— 


Sample range pairs (or sample object to copy) 
115 


-TIF condition (optional)——— 


z=1 


Hình 46 
Nhắn OK, ta thấy có sự thay đổi trong cửa số Workfile như sau 


cfilE: ED 


:i) : 


.| WWo rkfile: U NTT ; _— "8x 
(View|Prec| Object||Print| save| Detailse/-| |show | Fetch | Store |Delete| Genr | sample| 
Range: 120 — 20 0bs Filter: * 
Sample: 1 15 ifz=Z1 —- 9obs 


[8] c 
Kresid 
&x 
AAry 
&Az 


< +Ì Untitled / New Page / 
Hình 47 
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12. Tính các giá trị thống kê 

Để tính các giá trị thống kê như Trung bình, trung vị, độ lệch chuẩn, ...của các biến 
có trong mô hình chắng hạn vớ số liệu cho trong ví dụ 4 ta làm như sau: 

Từ cửa số EViews chọn Quiek —›Group Statisties —Deseriptive statistics 
—>Common sample, như hình sau 


Empty Group (Edit Series) 
: Series Statistics 


Estimate Equation... Covariances 


Estimate VAR,.. Correlations 


Cross Correlogram. 
Johansen Cointegration Test 
Granger Causality Test 


Hình 48 
Nhấp chuột và nhập tên các biến vào cửa số Series List như hình sau 


Hình 49 
Nhấp OK, ta được bảng các giá trị thống kê sau: 
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{Ế] Group: UNTITLED Workfile: UNTITLEDzUntitled\ 


Aewnoc|objed] |Pamname| re] |Sanpe]sheet]ies|spec 
, “—.; x2 x3 | 


Mean. 1443333 2041887 1218887 ^ 
'Median 1415000 2050000 1200000 

Mamum 1800000 2800000  17.00000 

Minimum 1020000 1500000  8.000000 

_Std. Dev. 232089 4187825 3352972 

_Skewness -0218444  -0034924  -0.453123 

'Kurtosis 2301580 1401529 2378514 

.Jarque-Bera 0.339345 1279994 0603763 

_Probabililty 0843941 0527294 0739428 

§um__ 1898000 2450000  148.0000 

SumSq De. | 5924887 1929187 1238887 

Observations _ 12 12 12 

5 v 


Hình 50 Giải 


-Mean : trung bình. 
-Mcedlian : trung vị 
-Maximum : Giá trị lớn nhất - Minimum : Giá trị nhỏ nhất 
-Std. Dev : Độ lệch chuẩn 
-Skewness : Hệ số bất đối xứng 
-Kurtosis : Hệ số nhọn 
-Jarque — Bera : Kiểm định phân phối chuẩn 
-Sum : Tổng các quan sát 
-Sum sq. Dev : Độ lệch chuẩn của tổng bình phương 
-Observations : Số quan sát (cỡ mẫu) 
13. Các bài toán kiểm định giả thiết mô hình 
13.1. Kiểm định phương sai thay đổi 
13.1.1. Kiểm định White 
Chăng hạn như trong ví dụ 4. 
Đề thực hiện việc kiểm định White bằng Eview, sau khi ước lượng mô hình hồi quy 
mẫu, từ cửa số Equation chọn View->Residual Diagnosties — Heteroskedasticity 
tests... Khi đó màn hình sẽ như sau: 
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[Mew[mec|osjea] [Pam]Name|rreez ————— _ 


| Representations 
Estimation Output 
Actual,Fitted,Residual } 
ARMA Structure... 
Gradients and Derivatives *Ì Std Error  t-Statistic Prob. 
Covariance Matrix 
8.253073 5.181823 0.0006 
Coeffi cient Diagnostics 2 0. 328573 ự 6828105 0. 0000 
__ Residual Diagnostics mmmam = €orrelogram - Q-statistics... 
Stability Diagnostics } Correlogram Squared Residuals... 
Lạb el Histogram - Normality Test 
x zr.zZÓ0 Serial Correlation LM Test... 
gm Iikelihood -3194815 
F-statisfic 1803545 _ Hegedkelalidulets. 
Prob(F-statfistic) 0.000000 
Hình 51 


Nhắấp chuột, màn hình như sau 


Dependent variable: RESID“*2 
The White Test regresses the squaredi 


residuals on the the cross produict of 
the original regressors and a constant, 


[#ÌIndude White cross terms 


Hình 52 
Ta chọn White, rồi nhấn Ok. Ta có kết quả như sau: 
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klecj\ 


m——m—— ,Forecast|stat | Resids 


Heteroskedasticity Test: White 


F-statistic 0.843820 Prob.F(5,6) 0.5645 


Obs*R-squared 4954369 Prob. Chi-Square(5) 0.4215 
Scaled explained SS 2033498 Prob. Chi-Square(5) 0.8445 
Test Equation: 


Dependent Variable: RESID^2 
Method: Least Squares 

Date: 06/08/13 Time: 21:40 
Sample: 1 12 

Included observafions: 12 


Variable Coefficient Std. Error t-Statistic Prob. 

c -302.2919 2010729 -1.503394 0.1834 

x2 31.71005 20.36090 1.557400 0.1704 

Xx2^2 -0.879882 0520485 -1.6905B8 0.1419 

Xx2*x3 0.208825 0.538312 0.385270 0.7133 

x3 0.587451 10.18183 0.057895 0.9559 

x3^2 -0.075395 0534322  -0.141104 0.8924 

R-squared 0.412884  Mean dependent var 12.01891 

Adjusted R-squared -0.078418  S.D. dependent var 15.18494 

S.E. of regression 15.73389_ Akaike info criterion 8.B58339 

Sum squared resid 1485.295 Schwarz criterion 8.898792 

Log likelihaood -45.93803_ Hannan-Quinn criter. 8.566574 

F-statistic 0.843820 Durbin-VWatson stat 2.579780 
Prob(F-statistic) 0.584521 

Hình 53 


Ta đặt bài toán kiểm định như sau: H:o Mô hình không xảy ra hiện tượng phương 
sai thay đổi; H:¡ Mô hình xảy ra hiện tượng phương sai thay đổi. 


Từ bảng kiểm định White ở trên, ta có P_value [I 0.4215 HH cho trước nên chấp 
nhận H .o Vậy mô hình không xảy ra hiện tượng phương sai thay đồi. 
13.1.2. Kiểm định Glejser. 

Ta thực hiện các bước như trong kiểm định White nhưng ta chọn Glejser, rồi nhắn 
Ok. Ta có kết quả như sau: 
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Tr U4::Untitled\ 


————- "= T————— 


Hetearoskedasticity Test Glejser xˆo 


F-statistic 0.6851938  Prob F(29) 0.5440 
Obs*R-squared 1518508 Prob. Chi-Square(2) 0.4880 
Scaled explained SS 0.831349 Prob Chi-Square(2) 0.8277 E 
Test Equation: 

Dependent Variable: ARESID 


Method: Least Squares 
Date: 068/08/13. Time: 21:42 
Sample: 1 12 

Included abservations: 12 


Variable Coefficient Std. Error t-Statistic Prob. 

C 2890494 3.185754 0.844539 0.4203 

x2 -0.127881 0187398 -0.783934 0.4845 

x3 0.232343 0.209078 1.111273 0.2953 
R-squarad 0.1268542 Mean dependeni var 2.9808429 
Adjusted R-squared -0.087559 5.D. dependent var 1.973897 
S.E. of reqression 2039485 Akaike info criterion 4475590 
Sum squared resid 3743551 Schwarz criterion 4.596817 
Log Iikelihaod -23.85354_ Hannan-Quinn criter. 4 430708 
F-statistic 0.6851938 Durbin-Watson stat 1.8306871 
Prob(F-statistic) 0.543987 „ 

Hình 54 


Ta đặt bài toán kiểm định như sau: H :¿_ Mô hình không xảy ra hiện tượng phương 
sai thay đổi; H:¡ Mô hình xảy ra hiện tượng phương sai thay đối. 


Từ bảng kiểm định Glejser ở trên, ta có P_value [I 0.4680 HH cho trước nên chấp 
nhận H .o Vậy mô hình không xảy ra hiện tượng phương sai thay đồi. 
13.1.3. Kiểm định Breusch-Pagan-Godfrey 

Ta thực hiện các bước tương tự như kiểm định White nhưng ta chọn 
BreuschPagan-Godfrey, rồi nhắn Ok. Ta có kết quả như sau: 
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Epmmmm.rmmamn.. _"x. 


(View |Proc| Object||Print| Name |Freeze |Egimate |Forecast stats |Residsi 


Heteroskedasticity Tast: Breusch-Pagan-Godfrey = 


F-statistic 0.598913 Prob. F(2,8) 0.5708 
Obs*R-squared 1.405352 Prob. Chi-Square(2) 0.4853 
Scaled explained SS 0.578820 Prob. Chi-Square(2) 0.7495 Ẫ 
Test Equation: 

Dependant Variable: RESID*^2 


Ilethod: Least Squares 
Date: 08/08/13 Time: 21:48 
Sample: 1 12 

Included observafions: 12 


Variable Coefficient Std. Error t-Statistic Prob. 

& 10.83993 24.80707 0.432393 0.6758 

xa -0.853785 1292998  -0.737639 0.4795 

x3 1.713837 1.814940 1.081239 0.3182 
R-squared 0.117113  Mean dependent var 12.01891 
Adjusted R-squared -0.079085 S.D. dependenit var 15.18494 
S.E. of regression 15.75318 Akaike info criterion 8.584280 
Sum squared resid 2233488 Schwarz criterion 8.6885507 
Log likelihaod -48.38588 Hannan-Quinn criter. 8.519398 
F-statistic 0.5989813 Durbin-Watson stat 2.193097 
Prob(F-statistic) 0.570918 Ki 

Hình 55 


Ta đặt bài toán kiểm định như sau: H:¿ Mô hình không xảy ra hiện tượng phương 
sai thay đổi; H:¡ Mô hình xảy ra hiện tượng phương sai thay đổi. 


Từ bảng kiểm định Breusch — Pagan - Godfrey ở trên, ta có 
P_ value [1 0.4953 II cho trước nên chấp nhận H .o Vậy mô hình không xảy ra hiện tượng 
phương sai thay đổi. 
13.2. Kiểm định tự tương quan (Kiểm định BG) Chẳng 

hạn như trong ví dụ 4. 

Đề thực hiện việc kiểm định BG bằng Eview, sau khi ước lượng mô hình hồi quy 
mẫu, từ cửa số Equation chọn View—>Residual Diagnostics —› Serial Correlation LM 
test... Khi đó màn hình sẽ xuất hiện như sau: 


lẫn” 


————>——— 


ÍView|Prec|objed] [Punt|Name m— —— 


Representations Ệ 
Esttmation Output 
Actual,Fitted,Residual } 
ARMA Structure... 
Gradients and Derivatives *Ì SidEmor t9ialisic  Prob. 
Covariance Matrix 
825303 51681823 00006 
Coefficient Diagnostics } 0. 328573 T 628105 0. 0000 
_ Residual Di nostics j Cgitelygd° Q-statistics... 
Stability Diagnostics lộ Correlogram Squared Residuals... 
Label Histogram - Normality Te9 
ưa T0 tr.zz0 _ 3erial Correlation LM Test... 
Lữ likelihood -31.84615 Heterogadszbcik Teäx 
F-statistic 180.3545 ° gi hhoiocx 


Prob(F-statis†ic) 0.000000 


Hình 56 
Nhâp chuột, cửa sô sau xuât hiện như sau: 


Lag Specification '__"=_¡ 


Hình 57 
Ô Lags to indude ta gõ bậc tự tương quan vào (ví dụ như tự tương quan là bậc 2) 
Nhắn Ok. Ta có kết quả như sau: 
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Emm=nx= ) Workfile: VIDU4::Untitled. SA cóc 3 


len |noc|obje]|imt|Nane|rrse]|tmste]7areaa Sofa 


Breusch-Godfrey Serial Correlation LIM Test: = 


F-statistic 0481309 Prob. F(2,7) 0.8370 ` 


Obs*R-squared 1450708 Prob. Chi-Square(2) 0.4842 


Dependent Variable: RESID 

IMethod: Least Squares 

Date: 08/08/13 Time: 22:00 

Sample: 1 12 

Included observations: 12 

Presample missing values lagqed residuals set to zero. 


Tes† Equation: | 
| 


Variable Coefficient Std. Error t-Statistic Prob. L 

C -0.843019 8.704450  -0.125740 0.9035 

xa 0.027882 0.353558 0.078238 0.9398 

x3 0.031521 0.442787 0.071191 0.9452 

RESID(-1) -0.321387 0384510 -0.835784 0.4309 

RESID(-2) 0.127392 0.428641 0.298592 0.7739 

R-squared 0.120892  Mean dependent var 2.04E-14 

Adjusted R-squared -0.381455 SD. dependentvar 3.620988 

S.E. of raegression 4255938 Akaike info criterion 8.028844 

Sum squared resid 1286.7910 Schwarz criterion 8.230888 

Log Ilikelihood -31.17308 Hannan-Quinn criter. 5.954040 

F-statistic 0.240655 Durbin-Watson stat 1.891410 
Prob(F-statistic) 0.906548 

Hình 58 


Ta đặt bài toán kiểm định như sau: H :_ Mô hình không xảy ra hiện tượng tự 
tương quan bậc 2; H:¡ Mô hình xảy ra hiện tượng tự tương quan bậc 2. 


Từ bảng kiểm định BG ở trên, ta có P_ value [ 0.4842 HH cho trước nên chấp 
nhận H .o Vậy mô hình không xảy ra hiện tượng tự tương quan bậc 2. 
13.3. Kiểm định biến có cần thiết trong mô hình hay không (Kiểm định Wald) Chẳng 

hạn như trong ví dụ 4. 

Đề thực hiện việc kiểm định Wald bằng Eview, sau khi ước lượng mô hình hồi quy 
mẫu, từ cửa số Equation chọn View-›Coefficient Diagnosftics — Wald test — 
Coefficient Restrictions... Khi đó màn hình sẽ như sau: 
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| Representations 
Estimation Output 
Actual,Fitted,Residual › 
ARMA Structure... 

Gradients and Derivatives lỗ mau ttagayke —¬ 


Covariance Mlatrix 


B.253073 5161823 0.0006 


© t Dia kS } Scaled Coefficients 

Residual WPSossfet } Confidence Intervals... 

Su Diagnostics } €Confidence Ellipse... 

Label Variance Inflation Factors 

E xzzu Coefficient Variance Decomposition 
Log likelilood -31.94615 
F-statistic 180.3545 : ị cient Restricti 
Omitted Variables Test - Likelihood Ratio... 


Prob(F-statistic) 0.000000 


[_ Redundant Variables Test - Likelihood Ratio... 
Eactor Breakpoint Test... 


Hình 59 


Nhấp chuột ta có cửa số sau xuất hiện: Gõ c(2)=0 vào 


C(1)=0, C(G)=2*C(2) | [_œ_ ][ ca 


Hình 60 Nhấp 


Ok. Ta được kết quả như sau: 
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(E] Equation: UNTTLED Workfile: VIDU4zUntiled  — ñ X: 


Aven|noc|obiea] [mm] name re] [atmste]aesaa] su; 


Wald Test: 
Equation: LUntitle d 


Test Statistic Value df Probability 


t-statistic 7.B26105 9 0.0000 
F-statistic 58.15747 (1,9) 0.0000 
Chi-square 58.15747 1 0.0000 


Null Hypothesis: C(2)=0ũ 
Null Hypothesis Summary: 


hormalized Restriction (= 0) Value Std. Err. 


C(2) 2.505729 0.328573 


Resitrictlions are linear in coefficients. 


Hình 61 
Ta đặt bài toán kiểm định như sau: H:ø Biến X2 không cần thiết trong mô hình; 


H:¡ Biến X2 cần thiết trong mô hình. 


Từ bảng kiểm định Wald ở trên, ta có P_ value [1 0.0000 HH cho trước nên bác bỏ 
H .› Vậy X2 cần thiết trong mô hình. 

Lưu ý: Trong trường hợp này ta chỉ khảo sát X2 nên ta có thể dùng giá trị xác suất 
của thống kê t hoặc giá trị xác suất của thông kê F đều được. Trong trường hợp ta khảo sát 
nhiều hơn hai biến thì ta chỉ dùng thống kê F. 

13.4. Kiểm định thừa biến trong mô hình (biến không cần thiết) Giả 

sử xét ví dụ 4 bên trên, ta tiễn hành như sau: 

- Tìm hàm hồi quy của Y theo X2 và X3. Từ cửa số Equation, ta chọn 
View—>Coefficient Diagnosfics —› Redundant Variables Test — Likelihood ratio... Khi 
đó màn hình sẽ như sau: 
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Estimation Qutput 
Actual,Fitted,Residual } 
ARMA Structure... 

Gradients and Derivatives l4 
Covariance Matrix 


Std. Error †-Statistic Prob. 


B.2530/3 5161823 0.0006 


( Scaled Coefficients 

Residual Diagnostics } Confidence Intervals... 

Stability Diagnostics €onfidence Ellipse... 
Variance Inflation Factors 


Label 


uTrrSqưargưrgsru .zzus Coefficient Variance Decomposition 

Log likelihood -31.94815 —————=—=—— 
F-statistic 180.3545 Wšb Tt:.Cocfiilled'Ecoiiditne.. 
TƯ Tnhh ii 0:000000 Omitted Variables Test - Likelihood Ratio... 


` : =T Ề 
DĐCQM HH-Q@dIHL VdlidDIE3 tcat- 


Factor Breakpoint Test... 


===———————————————— —ỄỄễễ 
Hình 62 


Nhâp chuột ta có cửa sô One or more fest series to remove xuât hiện, rôi gõ biên 
X3 vào 


Hình 63 Nhấp 


Ok, ta có kết quả sau: 
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———————_—_—— 


Redundant \⁄ariables Tes† 
Equation: UNTITLED 
Specification: Y C X2 X3 
Redundant Variables: X3 


1" 


Value đf Probabili 

t-statistic 11.58572 8 0.0000 

F-statistic 134.4B08 (1,8) 0.0000 

Likelihood ratio 33.22805 1 0.0000 
Hình 64 


Ta đặt bài toán kiểm định như sau: H :ạHH; 


0: Biến X3 không cần thiết trong mô 


hình; H:,H1ñ; 0: Biến X3 cần thiết trong mô hình. 


Từ bảng kiểm định ở trên, ta có P_ value [I 0.0000 HH cho trước nên bác bỏ H . 


Vậy X3 cần thiết trong mô hình. 


13.5. Kiểm định biến bị bỏ sót trong mô hình 
Giả sử xét ví dụ 4 bên trên, ta tiến hành như sau. 


- Tìm hàm hồi quy mẫu của Y theo X2. 


Từ cửa sô Equatfion, ta chọn 


View—>Coefficient Diagnostics — Omitted Variables Test — Likelihood ratio... Khi đó 
mản hình sẽ như sau: 


Representations 
Estimation Output 
Actual,Fitted,Residual 
ARMA Structure... 
Gradients and Derivatives 


Covariance Matrix 
€Coefficient Diagnostics 
Residual Diagnostics 
Stability Diagnostics 


kabel 


15.7074 


Std. Error 


22.71359 


t-Statistic Prob. 


2.325807 
Scaled Coefficients 


Confidence Intervals... 


0.0424 


Confidence Ellipse... 
Variance Inflation Factors 


Coefficient Variance Decomposition 


F-statistic 
Prob(F-statistic) 0.002638 Wald Test- Coefficient Restrictions... 
Omitted Variables Test - Likelihood Ratio... 
Redundant Variables Test - Likelihood Ratio.. 
Factor Breakpoint Test... 
Hình 65 


Nhấp chuột ta có cửa số One or more test series to add xuất hiện. Ta gõ biến X3 
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ˆ s \ X > 
_Omitted Variables Test x - 


T= ` " vơ : NTI .Í \ & ` TP 18, h Sài _Mv Ñ ¬. 
“Œt s.. ` = li 4Ó 
: — ‹ 


Omiited Variables Tes† su 
Equation: UNTITLED IE| 
Specification: Y C X2 

Omitted Variables: X3 


Value df Probability 
t-statistic 11.58572 9 0.0000 
F-statistic 134.46808 (1, 8) 0.0000 
Likelihood ratio 33.22605 1 0.0000 
Hình 67 


Ta đặt bài toán kiểm định như sau: H :o[;_ 0: Biến X3 ảnh hưởng tới Y (X3 
không bị bỏ sót); H:;; 0: Biến X3 bị bỉ sót trong mô hình. 


Từ bảng kiểm định ở trên, ta có P_ value [I 0.0000 HH cho trước nên bác bỏ H . 
Vậy X3 bị bỏ sót trong mô hình. 
13.6. Kiểm định Chow trong mô hình hồi quy với biến giả 
Ví dụ7. Giả sử số liệu về tiết kiệm và thu nhập cá nhân ở nước Anh từ năm 1946 đến 1963 
(đơn vị pound) cho ở bảng sau: 
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Hhrikgl ý Phan xo 
880 |l955 — |0.59 |155 | 
940 |1956 — |090 | 16.7 
10.0 |1957 — |095 |177 | 
hoo boss — bạn han 


5 12 búa lọe — lu bịt, 


Bảng 10 
Trong đó, Y : Tiết kiệm ; X : Thu nhập. 
Đề kiểm định rằng có sự thay đổi về tiết kiệm giữa hai thời kỳ hay không, ta thực 


hiện các bước kiểm định Chow như sau: 
Hồi ` Y theo X,ta Ai hg kết kia 


——————=————— 


Dependent ⁄ariabla: Y bR 
Ilethod: Leas† Squares 
Date: 06/10/13 Time: 14:07 
Sample: 1848 1883 
Included observafions: 18 


11 


Variable Coefficient Std. Error †-Statistic Prob. 

Éa -1.082071 0145151 -7.454820 0.0000. 

X 0.117845 0.008774 13.43184 0.0000 
R-squared 0.818537  Mean dependent var 0.773333 
Âdjustad R-squared 0.813448  S.D. dependent var 0.6842808 
S.E. of regression 0189114  Akaike info criterion -.388483 
Sum squared resid 0572228  Schwarz criterion -0.2895683 
Logq likelihood 54964368 Hannan-Quinn criter. -0.374852 
F-statistic 180.4090 Durbin-VWatson stat 0.847783 
Prob(F-statistic) 0.000000 

Hình 68 


Từ cửa số Equation, chọn View —›Stability Diagnosties —› Chow Breakpoint 
Test...như hình sau: 
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Print] Name | Freeze | |Estimate|Forecast| Stats] Resids] 


Ì 


Representations | 
Estimation Qutput | 
Actual,Fitted,Residual } 
ARMA Structure... 
Gradients and Derivatives °Í StdEmor tStaistic  Prob. 
Covariance Matrix 
0145151 -7 454820 0.0000 
Coefficient Diagnostics ›| 0008774 13.43184 0.0000 
Residual Diagnostics } Mean denenrlent var 0773333 
stability Diagnostics reakpoint T 
Label Quandt-Andrews Breakpoint Test... 
Ưu 'ƯƠC :røtxzzyu Chow Forecast Test... 
F-statistic 180.4090 
Prob(F-statistic) 0.000000 S384 A900 S09 
——TF----- Recursive Estimates (OLS only) ... 
L Evera g e Plots... 
( New Page /' Influence Statistics... 
Hình 69 
Sau khi nhấp chuột, một cửa số xuất hiện như sau: 


Lœ ] Lemz] 


Hình 70 
Ta gõ vào cửa số Chow Test giá trị Breakpoint là 1955 như hình trên, nhấp OK. 
Khi đó ta được kết quả sau: 


ló1 


{E] Equation: UNTITLED Workfile: UNTITLED::Untitled\, S36 — la. 2 


Men] moc|o0led)[mit|Nane|reex] |Eaimate]roree]sut:]sead:; 


Chow Breakpoint Test 1955 

Null Hypothesis: No breaks at specified breakpoints 
Varying regressors: Àll equation variables 

Equafion Sample: 1948 19683 


`» 


[..m.. 


F-statistic 5.037080 Prob. F(2,14) 0.0225 

Log likelihood ratio 9.757441 Prob. Chi-Square(2) 0.0078 

Wald Statistic 10.07412 Prob. Chi-Square(2) 0.0085 _ 
Hình 71 


và dự vào bảng kết quả trên ta cũng có giá trị F = 5.037. Với giá trị xác suất là 


0.022493. nên ta chấp nhập giả thuyết là hai mô hình hồi quy khác nhau. 
14. Định dạng mô hình (Kiểm định Ramsey RESET) Xét 


mô hình gốc: 
Y:HH HL:›X: HH: (1) 
Kiểm định Ramsey RESET 


Y:LH HH:zX: HL:Y*s HH; Ys LH... mm ¡ï HH]: (2) 


Bài toán kiểm định 
HH :¿H ññ 11H, › & 0 
HITTH : 


Họ : Mô hình gốc không thiếu biến, dạng hàm đúng Hi 
: Mô hình gốc thiếu biến, dạng hàm sai 
Rz:HRsn Hk: 


EFH_ — IHRz:H ~F(mnIk 
} ĩm 
Giả sử xét ví dụ 3 bên trên, ta tiến hành như sau: 
Tìm hàm hồi quy tuyến tính mẫu của Y theo X. Từ của số Equation. 


Chọn View —>Stability Diagnosties —Ramsey RESET Test...như hình sau: 
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Representations 


Esttmation Output 
Actual,Fitted,Residual › 
ARMA Structure... 
Gradients and Derivatives | SidEror tStatistic  Prob. 
Covariance Matrix 
1.879285 13.70458 0.0000 
Coefficient Diagnostics »| 0.101321 16.38082 
Residual Diagnostics * Maan denandent var 57 nnn 


ị §tability Diagnostics Chow Breakpoint Test... 
Label Quandt-Andrews Breakpoint Test... 
JỤ ƯƠU ZT: sào Chow Forecast Test... 

F-statistic 2868.3312 Ramsey RESET Te 

Prob(F-statistic) 0.000000 SiEho- 2 n06:sexf2S2205 12a v2 0C 

— << Recursive Estimates (OLS only) ... 
Leverage Plots... 
Influence Statistics... 

Hình 72 
Nhấp chuột ta có cửa số Number of fitted terms xuất hiện. Ta gõ tham số m=l vào 
r _—_— —_—=“S-___—_—— — — ( 


Lœ ] [ am j 


Hình 73 Nhấp 
Ok, ta được kết quả sau: 


Ramsey RESET Test 
Equation: UNTITLED Lẩ 
Specification: Y C X 

Omitted Variables: Squares of fifted valuas 


Value df Probabili 
†t-statistic 1.177282 T 0.2776 
F-statistic 1.3859984 (1,7) 0.2778 
Likelihood ratio 1.808528 1 0.1788 ° 
Hình 74 


Ta đặt bài toán kiểm định như sau: Ho, 0: Mô hình trên không thiếu biến, 
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dạng hàm đúng: H:,[,_ 0: Mô hình trên thiếu biến dạng hàm sai. 


Từ bảng kiểm định ở trên, ta có P_ value(F_ statistic) H 0.2776 HH cho trước nên 
chấp nhận H .› Vậy mô hình trên không thiếu biến, dạng hàm đúng. 
15. Lưu kết quả trong Eviews 

15.1. Lưu file dữ liệu 

Các thao tác được thực hiện như sau: 

Sau khi làm xong các thao tác. Từ cửa số Eviews chọn File —>Save 

Lưu ý: Khi đó trên cửa số Workfile thì không có đối tượng nào được chọn (Nếu 
không ta chỉ lưu được một file dạng rác). 

Workfile: VIDU4 - (c:\users\trungdong\desktop\vidu4.wf1) _. k 


Range: 112 — 120bs Filter: ” 
Sample: 1 12 — 12 obs 


C 
canduoi 
& cantren 
šHj graph01 


‹ +) Untitled ( New Page / 
Hình 75 

15.2. Lưu các bảng kết quả 

Trên các cửa số như Equation, Graph, Group, ...Đều có thanh công cụ chứa hai 
nút là : Name và Freeze dùng để lưu trữ các đối tượng hoặc các kết quả được tạo ra trong 
quá trình thao tác. Đối với chức năng Name cho phép ta lưu trữ các kết quả mà ta có thể 
dùng tiếp cho các thao tác sau. Mặt khác chức năng Freeze chỉ lưu các kết quả dưới dạng 
một Table (Kết quả đó được đóng băng). 

Chẳng hạn với số liệu trong ví dụ 3 sau khi tìm được mô hình hồi quy xong và ta 
thực hiện lưu trữ như sau: 

Từ cửa sô Equation. Nếu ta chọn chức năng Name như hình 63 
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E =ì 


“ở. 


Daependent Variable: Y 
Ilethod: Leas†t Squares 
Datea: 08/08/13 Time: 22:44 
Sample: 1 12 


~Name to identify object 


mohinh 


24 characters maximum, 16 
or fewer recommended 


R-squared 
Adjusted R-square 
S.E. nf regressinn 
Sum squared resid. 
Log likelihood 
F-statistic 
Prob(F-statistic) 


=—= —. 


Hình 76 
Chọn OK ta được kết quả có biểu tượng là 
[El mehinh 


| graph01 
mh 

f mh1 
mohinh 


Hình 77 


Từ cửa số Equation. Nếu ta chọn chức năng Freeze thì ta thấy một table mới xuất 
hiện như sau: 
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[El Table: UNTITLED Workfile: VIDU4::Untitled\ TẾ 


: 1233 
S.Ũ.Ê 23.20/09 


S.E. of regression 4003151 Akaike info criterion 5.824358 
uIm squared residi 1442288 Schwarz criterion 5945585 
Log likelihaod -31.84815 Hannan-Quinn criter. 5779476 
F-statistic 180.3545 Durbin-Watson stat 2527238 
Prob(F-statistic) 0.000000 
Hình 78 


Chọn OK ta được kết quả có biểu tượng là 
mahinh1 
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